模力方舟平台常见问题解答 (FAQ)

第一部分：模型广场与 API 调用

Q1：为什么标注为“免费”的模型无法使用？

用户需购买任意金额的全模型资源包，并创建一个访问令牌（Token），使用该令牌即可调用免费的API服务。

Q2：模型API访问速度较慢，能否为账号增加专属实例？

模型广场的 API 资源为公共池，不支持单账号扩容。当前 Serverless API 不单独限制并发，但如果您有高并发业务需求，建议使用“专属算力部署”服务（https://ai.gitee.com/compute-deploy），部署独享资源以避免干扰；如需进一步评估资源方案，也可以联系我们。

Q3：异步任务出现大量调用错误是什么原因？

单个用户同时创建的异步任务上限为5个，请检查当前任务并发数是否超限。

Q4：异步任务支持回调吗？

目前不支持自动回调。请通过轮询接口（https://ai.gitee.com/docs/openapi/v1#tag/%E5%BC%82%E6%AD%A5%E4%BB%BB%E5%8A%A1）查询任务执行结果。

Q5：各类异步任务的完成时长大概是多少？

平均耗时参考如下：音频生成任务约1-2分钟；视频生成任务视分辨率而定，平均约20分钟；OCR识别任务约1-5分钟（多页PDF文件可能延长）。

Q6：购买前是否可以体验？

在购买之前，您可以在 AI 模型广场免费体验所有精选模型。

免费体验模型

选择“免费体验访问令牌”即可享受免费体验，每位用户每日拥有 100 次免费调用次数：

调用次数

Q7：如何查看和管理已购买的资源？

下单并支付完成 Serverless API 或应用后，我们会为您准备对应的服务。准备完成后，您可以在工作台对应资源的页面，看到您所购买的资源。

输入图片说明

Q8：组织下的资源如何管理？

切换到组织工作台下：

组织创建者和管理员可以在工作台管理已创建的资源、订单和费用等。
组织成员则可以在工作台查看已购买的模型引擎和 Serverless API，并且管理自己创建的模型和数据集。

Q9：如何查看资源的使用情况和消耗量？

在工作台 - 统计和日志下，您可以查看所有资源的用量统计和使用日志。

输入图片说明

Q10：已购买的资源，可以退款吗？

已使用的 Serverless API 暂不支持退款。

Q11：账户余额怎么提现？

目前我们不支持线上提现，如果您有提现需求，请联系我们。

Q12：支付成功，但支付页提示“订单仍未支付”怎么办？

如果您已完成支付，但返回支付页面点击 已完成支付 按钮时提示“订单仍未支付”，请通过向 gitee-ai@oschina.cn 发送邮件与我们联系。

在邮件内，您需要提供该笔订单的订单号，以及对应的付款软件的付款截图。

Q13：提示访问令牌无效怎么办？

请核对“令牌”是否正确，或检查令牌是否已被删除而无法继续使用。

Q14：提示访问令牌无任何可用资源怎么办？

请核对“令牌”是否已授权已购买资源，或检查授权资源是否已过期或使用完毕。

Q15：提示临时令牌无效怎么办？

请核对“令牌”是否正确，或检查其绑定的“访问令牌”是否已被删除，或者该临时令牌本身是否已失效。

Q16：提示临时令牌无任何可用资源怎么办？

请核对绑定的“访问令牌”是否已授权已购买资源，或检查授权资源是否已过期或使用完毕。

Q17：接口调用常见报错如何排查？

状态码	异常信息(中文)	异常信息（英文）	备注
400	服务不存在	Service not found	请求路径不正确，请重新在体验接口中复制 URL。
400	已达到最大当日免费API使用次数, 请购买资源后继续使用API。	Today the free API access limit exceeded.	当前调用接口的访问令牌为“免费体验访问令牌”，每日限制接口调用次数，当前已达到最大调用次数，可付费购买资源包后配置付费访问令牌。
400	该令牌不能访问任何资源，请绑定或购买资源后使用	The access token cannot access any resources, purchase or authorize resources to use the access token	请核实该“访问令牌”是否已授权购买资源包，并且该资源包可用于调用该接口，可在“访问令牌”界面进行重新配置。
400	资源未购买或未授权,请购买或授权资源后再使用	Resources are not purchased or authorized. Purchase or authorize resources before using them.	请核实是否已购买资源包，或该资源包是否已用尽或过期，并且该访问凭证已授权该资源，可在“访问令牌”界面进行重新配置，或续费“资源包”。

Q18：接口升级后该使用哪个地址？

接口已全面升级，推荐使用兼容 OpenAI 的新接口，以获得更好的兼容性和长期支持。

OpenAI 格式：https://api.moark.com/v1
Anthropic 格式：https://moark.com/anthropic

新接口文档请参考：OpenAPI 文档。如果您仍需使用旧接口，请参考上述文档，但建议尽快迁移至新接口，以享受更优体验。

第二部分：AI技能认证（国产芯片联合项目）

Q1：如何参加AI技能认证？

请访问官方认证页面（https://ai.gitee.com/certification），根据您感兴趣的芯片厂商选择对应的认证通道。

Q2：我没有算力机器，如何参加技能认证？

您需在模力方舟算力市场租用题目指定的算力型号，在容器内完成答题，随后在认证页面关联该容器并提交检测。

Q3：参与认证必须使用模力方舟平台上的机器吗？

是的。由于该认证是与国产芯片厂商联合举办，为了保证环境一致性与结果公正，必须使用平台提供的对应芯片容器进行作答，方可获得官方认证证书。

Q4：通过认证后，申请证书需要多久才能收到？

由于涉及与芯片厂商进行线下盖章流程，证书制作与寄送周期通常为1至3个月，具体时长视厂商处理效率而定。

第三部分：算力市场（算力租用与环境配置）

Q1：平台的计费模式是怎样的？

主要包含两种模式：

按量收费：采用后付费模式，每整点结算一次。
包周期收费：适用于长期稳定的算力需求。

注意：当账户余额不足或租期结束时，实例将自动关机，数据仅保留 36 小时。

Q2：如果需要进行非GPU计算任务（如数据传输、CPU运算），如何操作？

建议选择无GPU模式开机。此模式仅调用CPU资源，收费标准为0.5元/小时，适用于数据处理或纯CPU计算任务。

Q3：关机后的数据保留期仅有 36 小时，如何延长？

您可在 36 小时期限届满前，进行一次“开机再关机”的操作，系统将重置保留时间的计时。

Q4：如何使用平台内置的模型库？

平台内置模型存放于 /mnt/moark-models/ 路径下，直接调用可节省下载时间。不同算力型号所含内置模型可能存在差异，请以实际目录为准。如需特定模型，可通过平台反馈渠道申请。

Q5：为什么在国产算力（如燧原、昇腾）上无法直接使用标准CUDA或PyTorch？

国产芯片架构与CUDA不直接兼容。使用PyTorch等框架时，必须通过厂商定制的框架或转换包实现。严禁用户自行安装或覆盖底层驱动、PyTorch、vLLM等环境，否则可能导致环境损坏，需重装镜像或销毁容器。

Q6：国产芯片的vLLM版本为何不是最新的？

vLLM适配国产芯片需厂商进行底层优化，通常滞后1-2个版本。若vLLM加载失败，建议尝试使用transformers库。适配周期一般为1-2个月。

Q7：在燧原S60中使用 transformers 并开启 flash_attention_2 报错怎么办？

因国产芯片底层对 flash-attention 的实现差异，建议改用 PyTorch 原生加速配置：attn_implementation="sdpa"。

Q8：引入 xformer 报错如何处理？

国产芯片环境对 xformer 的维护版本较低，存在兼容性风险（常见于diffusers模型）。如非必要，建议卸载相关依赖或避免在代码中引入 xformer。

Q9：为什么 nvidia-smi 指令无法查看GPU状态？

nvidia-smi 仅支持NVIDIA系列显卡。国产芯片需使用厂商配套的专用监控指令，请查阅对应芯片的说明文档。

Q10：租用的机器上传文件失败，或数据存储位置有什么要求？

Jupyter Lab仅适合上传小文件（建议十兆以内），大文件请通过SCP指令传输。此外，请务必将数据存放在 /data/ 路径下，避免因占用系统盘空间导致系统服务异常。

Q11：如何部署Web服务并进行公网访问？

容器环境不直接支持公网访问，需通过隧道代理方式。请参考文档“本地访问与服务封装指南”，通过拥有公网IP的服务器进行流量转发。

Q12：租用的机器出现运行故障怎么办？

请首先尝试在控制台执行重启操作。如问题依旧，请通过官方反馈页面提交工单，请勿强行修改底层环境配置。

第四部分：模型微调

Q1：是否有文本生成微调数据的示例？

是的。数据格式示例请参考：https://ai-assets.gitee.com/docs/assets/files/example-c83305527a14e647b3572952b934e84b.jsonl；具备结构化思考能力的训练数据集示例请参考：https://ai.gitee.com/datasets/wang-tu1357/gsm8k_thinking_chinese/tree/master。

Q2：图像微调开始处理后进度条未动，是什么原因？

可能的原因包括数据正在预处理中或服务处理异常。请尝试刷新页面或重新上传，若问题持续，请联系平台技术支持。

第一部分：模型广场与 API 调用​

Q1：为什么标注为“免费”的模型无法使用？​

Q2：模型API访问速度较慢，能否为账号增加专属实例？​

Q3：异步任务出现大量调用错误是什么原因？​

Q4：异步任务支持回调吗？​

Q5：各类异步任务的完成时长大概是多少？​

Q6：购买前是否可以体验？​

Q7：如何查看和管理已购买的资源？​

Q8：组织下的资源如何管理？​

Q9：如何查看资源的使用情况和消耗量？​

Q10：已购买的资源，可以退款吗？​

Q11：账户余额怎么提现？​

Q12：支付成功，但支付页提示“订单仍未支付”怎么办？​

Q13：提示访问令牌无效怎么办？​

Q14：提示访问令牌无任何可用资源怎么办？​

Q15：提示临时令牌无效怎么办？​

Q16：提示临时令牌无任何可用资源怎么办？​

Q17：接口调用常见报错如何排查？​

Q18：接口升级后该使用哪个地址？​

第二部分：AI技能认证（国产芯片联合项目）​

Q1：如何参加AI技能认证？​

Q2：我没有算力机器，如何参加技能认证？​

Q3：参与认证必须使用模力方舟平台上的机器吗？​

Q4：通过认证后，申请证书需要多久才能收到？​

第三部分：算力市场（算力租用与环境配置）​

Q1：平台的计费模式是怎样的？​

Q2：如果需要进行非GPU计算任务（如数据传输、CPU运算），如何操作？​

Q3：关机后的数据保留期仅有 36 小时，如何延长？​

Q4：如何使用平台内置的模型库？​

Q5：为什么在国产算力（如燧原、昇腾）上无法直接使用标准CUDA或PyTorch？​

Q6：国产芯片的vLLM版本为何不是最新的？​

Q7：在燧原S60中使用 transformers 并开启 flash_attention_2 报错怎么办？​

Q8：引入 xformer 报错如何处理？​

Q9：为什么 nvidia-smi 指令无法查看GPU状态？​

Q10：租用的机器上传文件失败，或数据存储位置有什么要求？​

Q11：如何部署Web服务并进行公网访问？​

Q12：租用的机器出现运行故障怎么办？​

第四部分：模型微调​

Q1：是否有文本生成微调数据的示例？​

Q2：图像微调开始处理后进度条未动，是什么原因？​