![]()
data-to-paper 是一个自动化框架,它通过引导多个交互的 AI 智能体,系统地完成从端到端的完整科学研究过程。
该过程仅从原始数据开始,最终生成透明、可回溯、可由人类验证的科学论文
(AI 生成的论文示例,
副驾驶应用 DEMO)。
本代码库是论文《"Autonomous LLM-Driven Research — from Data to Human-Verifiable Research Papers"》的实现。

pip install data-to-paper
然后运行:data-to-paper
依赖项请参阅 INSTALL。


https://github.com/Technion-Kishony-lab/data-to-paper/assets/31969897/0f3acf7a-a775-43bd-a79c-6877f780f2d4
data-to-paper 框架作为一个研究项目而创建,旨在理解 LLM 驱动科学研究的潜力和局限,并开发利用 LLM 加速研究的方法,同时保持甚至提升科学的核心价值,如透明度、可追溯性和可验证性,并允许科学家监督和指导整个过程(另请参阅:动态指南)。
为实现这一目标,data-to-paper 系统地引导交互的 LLM 和基于规则的智能体,沿着传统的科学路径前进:从带注释的数据开始,到创建研究假设、进行文献检索、编写和调试数据分析代码、解读结果,最终逐步撰写完整的研究论文。
data-to-paper 框架在以下 NEJM AI 论文中进行了描述:
* Tal Ifargan, Lukas Hafner, Maor Kern, Ori Alcalay 和 Roy Kishony,
"Autonomous LLM-Driven Research — from Data to Human-Verifiable Research Papers"
10.1056/AIoa2400555
以及以下预印本:
* Tal Ifargan, Lukas Hafner, Maor Kern, Ori Alcalay 和 Roy Kishony,
"Autonomous LLM-driven research from data to human-verifiable research papers",
arXiv:2404.17605
我们在以下测试案例上运行了 data-to-paper:
尝试运行:
data-to-paper diabetes
尝试运行:
data-to-paper social_network
尝试运行:
data-to-paper npr_nicu
我们为这篇论文的研究问题定义了三个难度级别。
1. 简单:比较两种预测最佳插管深度的机器学习方法
尝试运行:
shell
data-to-paper ML_easy
中等:比较一种机器学习方法和一种基于公式的方法来预测最佳插管深度
尝试运行:
shell
data-to-paper ML_medium
困难:比较 4 种机器学习方法和 3 种基于公式的方法来预测最佳插管深度
尝试运行:
shell
data-to-paper ML_hard
我们邀请大家尝试使用 data-to-paper 处理自己的数据,并热切期待反馈和建议。
目前它主要设计用于相对简单的研究目标和数据集,旨在提出并检验统计假设。
我们也邀请大家帮助开发和扩展 data-to-paper 框架,无论是在科学领域还是其他领域。
免责声明。 使用本软件即表示您同意承担使用本软件所涉及的所有风险,包括但不限于数据丢失、系统故障或可能出现的任何其他问题,特别是(但不限于)在本地机器上运行由 LLM 生成的代码所带来的后果。本项目的开发者对因使用本软件而可能发生的任何损失、损害或其他后果不承担任何责任。
责任归属。 您对生成的手稿的全部内容负全责,包括其严谨性、质量、伦理以及任何其他方面。整个过程应由人类参与监督和指导,生成的手稿应由领域专家仔细审查。该过程并非万无一失,必须有人类干预以确保结果的准确性和质量。
合规性。 您有责任确保基于本软件输出所做的任何行动或决定符合所有适用的法律、法规和道德标准。本项目的开发者和贡献者不对使用本软件产生的任何后果负责。此外,data-to-paper 生成的手稿会添加水印以透明标识为 AI 生成。用户不应移除此水印。
令牌使用。 请注意,通过外部 API 使用大多数语言模型(尤其是 GPT-4)可能会因令牌使用而产生高昂费用。使用本项目即表示您承认自己负责监控和管理自己的令牌使用及相关费用。强烈建议您定期检查 API 使用情况,并设置必要的限制或警报,以防止产生意外费用。
以下是一些其他很酷的多智能体相关项目:
* SakanaAI
* PaperQ2A
* LangChain
* AutoGen
* AutoGPT
* MetaGPT
以及这个精选的 awesome-agents 列表。