模型引擎

模型引擎

开箱即用的模型引擎,能迅速让 AI 开发者体验和部署模型,多样化的算力类型为用户提供更多、更经济的选择。

ADVANTAGE

产品优势

轻松部署
将你的模型转化为生产就绪的 API,无需复杂算力部署,让你轻松应对各种场景
降低成本
利用完全托管的生产解决方案进行推理,按量计费,为你提供经济实惠而高效的算力资源
丰富的模型支持
支持流行的文生图、文生文、文本分类、语音识别等模型,提供统一 API 调用,以满足丰富的应用场景功能
自由配置
从最新的英伟到顶尖的国产 GPU 如天数智芯、曙光智算,提供了更多选择空间,满足不同用户的需求
HOW IT WORKS

产品架构

开箱即用

迅速部署模型

模型引擎为你提供了一个开箱即用的生产解决方案,使 AI 开发者能够快速体验和部署模型。
用户创建模型引擎后,我们会为之分配选定的计算资源,并通过容器化技术隔离运行,借助算力中心内部的模型缓存,做到模型地快速下载和部署。部署成功后,我们将提供受保护的模型推理 API,为你提供安全可靠的推理 API 服务,我们提供了示例代码以便快速集成到 Gitee AI 在线应用或者本地应用中。
此外,我们提供多样化的算力类型,为你提供更多、更经济的选择。
HOW TO DEPLOY

部署方式

01
选择合适的模型
你可以从平台提供的数千个精选模型中选择,也可以使用你自己的定制模型,确保满足各种需求。无论是选择现成模型还是打造专属定制,都能在这里找到最合适的解决方案。
02
选择算力类型
在 Gitee AI 平台上,你可以选择你需要的算力类型,多家国内领先的算力服务商已经接入,而且还有越来越多的服务商正在积极接入中。这意味着你将有更多的选择,更灵活地满足你的计算需求。
03
选择安全级别
受保护的模型引擎可以通过互联网访问,使用 TLS/SSL 进行保护,并需要有效的 Gitee 令牌进行身份验证。这种安全机制确保了你的模型和数据的安全性,让你可以放心地使用平台提供的服务。
04
使用和管理你的引擎
模型引擎将在几分钟内准备就绪,让你可以立即开始工作。你可以轻松地定义自动缩放、访问日志和监控、设置自定义指标路由,以及使用 API/CLI 以编程方式管理引擎和回滚模型。这些功能让你可以更方便地管理和控制你的模型,保证系统的稳定性和可靠性。
只需点击几下即可部署模型,按资源调用支付费用。立即部署你的第一个模型引擎吧!
新建模型引擎