PaperCoder 是一个多智能体 LLM 系统,可将纸张转换为代码库。它遵循三个阶段的流程:规划、分析和代码生成,每个阶段均由专门的智能体处理。
我们的方法在 Paper2Code 和 PaperBench 上的表现都优于强基线,并且能够产生忠实、高质量的实现。
🔍 功能特点一览:
三阶段智能流水线:由规划智能体、分析智能体和代码生成智能体协作完成从论文到代码的完整转换流程。
支持多种输入格式:既可处理 PDF 转换后的 JSON 格式论文,也可直接解析 LaTeX 源码,适应不同的研究资料形态。
多模型后端支持:支持使用 OpenAI API(如 o3-mini 模型)或开源模型(通过 vLLM 服务,默认使用 DeepSeek-Coder-V2-Lite-Instruct)。
提供完整的评估体系:支持基于参考代码(reference-based)和无参考(reference-free)两种评估模式,使用模型批判关键实现组件并生成1-5分的正确性评分。
标准化输出结构:生成结构清晰的代码仓库,包含分析产物、编码产物和规划产物,方便后续检查和使用。
🎯 产品核心优势:
🚀 自动化程度高:能够自动将论文中的算法描述转换为可执行代码,极大减少人工实现的工作量和错误。
📊 性能卓越:在 Paper2Code 和 PaperBench 基准测试中均优于现有基线方法,生成的结果更忠实、质量更高。
🔧 易于使用:提供详细的设置说明和示例脚本,用户只需几条命令即可完成从环境配置到代码生成的整个过程。
📝 评估体系完善:内置模型驱动的评估方案,可从多个维度对生成的代码仓库进行质量评估,确保实现准确性。
- 开发者
模力方舟官方应用,为您提供高效智能的 AI 助手服务。
「智医灵枢」是一款面向医疗行业的全能型AI智能助手,专为医生与行政人员打造,深度融合人工智能与权威医学知识,全面覆盖临床诊疗与行政办公双重场景。
LUMI 是一款接入30+AI工具的小说推文视频制作平台,一键生成爆款小说视频! 集改写、配音、图片生成等于一体,告别繁琐流程,轻松产出高质、吸睛的推文视频。专为小说推文从业者与副业创富者设计,让你真正用 AI 高效变现,掘金流量时代!
AI文生图神器,一键开启,让创意秒现!注册免费试用,支持多图融合和动漫、写实、插画、3D等200+艺术风格,零基础玩转电商设计、社交创作。现在体验,让你的灵感瞬间跃然屏幕!

