API
HOT
模型
应用
解决方案
专区
文档
登录
THUDM
/
LongReward-llama3.1-8b-DPO
like
0
文本生成
Transformers
Safetensors
Chinese
English
AutoTrain Compatible
text-generation-inference
custom_code
模型介绍
模型文件
Issues
部署
LongReward-llama3.1-8b-DPO
/
model-00002-of-00005.safetensors
3 位贡献者
提交历史
model-00002-of-00005.safetensors
135 Bytes
一键复制
该文件使用 Git LFS 存储。文件过大无法显示,但您仍然可以下载。
Git LFS 详情
SHA256:
71fde0effdcd2bf87b70634566c218afbbaa5fd0
Pointer size:
135 Bytes
Size of remote file:
4.06 GB