作者: Xingyao Wang, Boxuan Li, Yufan Song, Frank F. Xu, Xiangru Tang, Mingchen Zhuge, Jiayi Pan, Yueqi Song, Bowen Li, Jaskirat Singh, Hoang H. Tran, Fuqiang Li, Ren Ma, Mingzhang Zheng, Bill Qian, Yanjun Shao, Niklas Muennighoff, Yizhe Zhang, Binyuan Hui, Junyang Lin, Robert Brennan, Hao Peng, Heng Ji, Graham Neubig
提交/修订日期: 2024年7月23日提交,2025年4月18日修订 (v3)
摘要:
软件是人类拥有的最强大的工具之一,它使熟练的程序员能够以复杂而深刻的方式与世界互动。与此同时,得益于大语言模型(LLMs)的进步,能够与环境互动并施加影响的AI智能体也迅速发展。本文介绍了OpenHands(原名OpenDevin),这是一个用于开发强大且灵活的AI智能体的平台,这些智能体以类似于人类开发者的方式与世界互动:通过编写代码、与命令行交互以及浏览网页。我们描述了该平台如何支持新智能体的实现、与沙盒化代码执行环境的安全交互、多个智能体之间的协调以及评估基准的整合。基于我们当前整合的基准,我们对智能体在15项具有挑战性的任务上进行了评估,包括软件工程(例如SWE-BENCH)和网页浏览(例如WEBARENA)等。OpenHands采用宽松的MIT许可证发布,是一个横跨学术界和工业界的社区项目,已收到来自超过188位贡献者的2100多次贡献。
主题/分类:
- 软件工程 (cs.SE)
- 人工智能 (cs.AI)
- 计算与语言 (cs.CL)
备注: 已被ICLR 2025接收;代码地址:https://github.com/All-Hands-AI/OpenHands