跳到主要内容
feedback
feedback

常见问题

模力方舟平台常见问题解答 (FAQ)


第一部分:模型广场(API调用)

Q1:为什么标注为“免费”的模型无法使用?

用户需购买任意金额的全模型资源包,并创建一个访问令牌(Token),使用该令牌即可调用免费的API服务。

Q2:模型API访问速度较慢,能否为账号增加专属实例?

模型广场的API资源为公共池,不支持单账号扩容。如有高并发业务需求,请使用“专属算力部署”服务(https://ai.gitee.com/compute-deploy),部署独享资源以避免干扰。

Q3:异步任务出现大量调用错误是什么原因?

单个用户同时创建的异步任务上限为5个,请检查当前任务并发数是否超限。

Q4:异步任务支持回调吗?

目前不支持自动回调。请通过轮询接口(https://ai.gitee.com/docs/openapi/v1#tag/%E5%BC%82%E6%AD%A5%E4%BB%BB%E5%8A%A1)查询任务执行结果。

Q5:各类异步任务的完成时长大概是多少?

平均耗时参考如下:音频生成任务约1-2分钟;视频生成任务视分辨率而定,平均约20分钟;OCR识别任务约1-5分钟(多页PDF文件可能延长)。


第二部分:AI技能认证(国产芯片联合项目)

Q1:如何参加AI技能认证?

请访问官方认证页面(https://ai.gitee.com/certification),根据您感兴趣的芯片厂商选择对应的认证通道。

Q2:我没有算力机器,如何参加技能认证?

您需在模力方舟算力市场租用题目指定的算力型号,在容器内完成答题,随后在认证页面关联该容器并提交检测。

Q3:参与认证必须使用模力方舟平台上的机器吗?

是的。由于该认证是与国产芯片厂商联合举办,为了保证环境一致性与结果公正,必须使用平台提供的对应芯片容器进行作答,方可获得官方认证证书。

Q4:通过认证后,申请证书需要多久才能收到?

由于涉及与芯片厂商进行线下盖章流程,证书制作与寄送周期通常为1至3个月,具体时长视厂商处理效率而定。


第三部分:算力市场(算力租用与环境配置)

Q1:平台的计费模式是怎样的?

主要包含两种模式:

  1. 按量收费:采用后付费模式,每整点结算一次。
  2. 包周期收费:适用于长期稳定的算力需求。

注意:当账户余额不足或租期结束时,实例将自动关机,数据仅保留3天。

Q2:如果需要进行非GPU计算任务(如数据传输、CPU运算),如何操作?

建议选择无GPU模式开机。此模式仅调用CPU资源,收费标准为0.5元/小时,适用于数据处理或纯CPU计算任务。

Q3:关机后的数据保留期仅有3天,如何延长?

您可在3天期限届满前,进行一次“开机再关机”的操作,系统将重置保留时间的计时。

Q4:如何使用平台内置的模型库?

平台内置模型存放于 /mnt/moark-models/ 路径下,直接调用可节省下载时间。不同算力型号所含内置模型可能存在差异,请以实际目录为准。如需特定模型,可通过平台反馈渠道申请。

Q5:为什么在国产算力(如燧原、昇腾)上无法直接使用标准CUDA或PyTorch?

国产芯片架构与CUDA不直接兼容。使用PyTorch等框架时,必须通过厂商定制的框架或转换包实现。严禁用户自行安装或覆盖底层驱动、PyTorch、vLLM等环境,否则可能导致环境损坏,需重装镜像或销毁容器。

Q6:国产芯片的vLLM版本为何不是最新的?

vLLM适配国产芯片需厂商进行底层优化,通常滞后1-2个版本。若vLLM加载失败,建议尝试使用transformers库。适配周期一般为1-2个月。

Q7:在燧原S60中使用 transformers 并开启 flash_attention_2 报错怎么办?

因国产芯片底层对 flash-attention 的实现差异,建议改用 PyTorch 原生加速配置:attn_implementation="sdpa"。

Q8:引入 xformer 报错如何处理?

国产芯片环境对 xformer 的维护版本较低,存在兼容性风险(常见于diffusers模型)。如非必要,建议卸载相关依赖或避免在代码中引入 xformer。

Q9:为什么 nvidia-smi 指令无法查看GPU状态?

nvidia-smi 仅支持NVIDIA系列显卡。国产芯片需使用厂商配套的专用监控指令,请查阅对应芯片的说明文档。

Q10:租用的机器上传文件失败,或数据存储位置有什么要求?

Jupyter Lab仅适合上传小文件(建议十兆以内),大文件请通过SCP指令传输。此外,请务必将数据存放在 /data/ 路径下,避免因占用系统盘空间导致系统服务异常。

Q11:如何部署Web服务并进行公网访问?

容器环境不直接支持公网访问,需通过隧道代理方式。请参考文档“本地访问与服务封装指南”,通过拥有公网IP的服务器进行流量转发。

Q12:租用的机器出现运行故障怎么办?

请首先尝试在控制台执行重启操作。如问题依旧,请通过官方反馈页面提交工单,请勿强行修改底层环境配置。


第四部分:模型微调

Q1:是否有文本生成微调数据的示例?

是的。数据格式示例请参考:https://ai-assets.gitee.com/docs/assets/files/example-c83305527a14e647b3572952b934e84b.jsonl;具备结构化思考能力的训练数据集示例请参考:https://ai.gitee.com/datasets/wang-tu1357/gsm8k_thinking_chinese/tree/master

Q2:图像微调开始处理后进度条未动,是什么原因?

可能的原因包括数据正在预处理中或服务处理异常。请尝试刷新页面或重新上传,若问题持续,请联系平台技术支持。