APIHOT 模型应用

THUDM/LongReward-llama3.1-8b-DPO

文本生成 Transformers Safetensors Chinese English AutoTrain Compatible text-generation-inference custom_code

模型介绍模型文件 Issues

LongReward-llama3.1-8b-DPO/model-00002-of-00005.safetensors

3 位贡献者

model-00002-of-00005.safetensors135 Bytes

一键复制

该文件使用 Git LFS 存储。文件过大无法显示，但您仍然可以下载。

Git LFS 详情

SHA256: 71fde0effdcd2bf87b70634566c218afbbaa5fd0
Pointer size: 135 Bytes
Size of remote file: 4.06 GB