API
HOT
模型
应用
解决方案
专区
文档
登录
THUDM
/
LongReward-llama3.1-8b-DPO
like
0
文本生成
Transformers
Safetensors
Chinese
English
AutoTrain Compatible
text-generation-inference
custom_code
模型介绍
模型文件
Issues
部署
新建 Issue
标题
描述
新建 Issue
取消