Paper2Code

Web 应用开发编程
立即访问
应用介绍

PaperCoder 是一个多智能体 LLM 系统,可将纸张转换为代码库。它遵循三个阶段的流程:规划、分析和代码生成,每个阶段均由专门的智能体处理。

我们的方法在 Paper2Code 和 PaperBench 上的表现都优于强基线,并且能够产生忠实、高质量的实现。


🔍 功能特点一览:

三阶段智能流水线:由规划智能体、分析智能体和代码生成智能体协作完成从论文到代码的完整转换流程。

支持多种输入格式:既可处理 PDF 转换后的 JSON 格式论文,也可直接解析 LaTeX 源码,适应不同的研究资料形态。

多模型后端支持:支持使用 OpenAI API(如 o3-mini 模型)或开源模型(通过 vLLM 服务,默认使用 DeepSeek-Coder-V2-Lite-Instruct)。

提供完整的评估体系:支持基于参考代码(reference-based)和无参考(reference-free)两种评估模式,使用模型批判关键实现组件并生成1-5分的正确性评分。

标准化输出结构:生成结构清晰的代码仓库,包含分析产物、编码产物和规划产物,方便后续检查和使用。


🎯 产品核心优势:

🚀 自动化程度高:能够自动将论文中的算法描述转换为可执行代码,极大减少人工实现的工作量和错误。

📊 性能卓越:在 Paper2Code 和 PaperBench 基准测试中均优于现有基线方法,生成的结果更忠实、质量更高。

🔧 易于使用:提供详细的设置说明和示例脚本,用户只需几条命令即可完成从环境配置到代码生成的整个过程。

📝 评估体系完善:内置模型驱动的评估方案,可从多个维度对生成的代码仓库进行质量评估,确保实现准确性。

feedback