作者: John Yang, Carlos E. Jimenez, Alexander Wettig, Kilian Lieret, Shunyu Yao, Karthik Narasimhan, Ofir Press
提交日期: 2024年5月6日
摘要:
软件工程是一项具有挑战性的任务,需要同时精通代码生成和与计算机的交互。本文介绍了 SWE-agent,这是一个利用语言模型与计算机交互以解决软件工程任务的自主系统。研究表明,定制的智能体-计算机接口(Agent-Computer Interface, ACI)极大地增强了智能体创建和编辑代码文件、导航整个代码仓库以及执行程序的能力。在 SWE-bench 基准测试中,SWE-agent 能够解决 12.5% 的问题,而之前基于检索增强生成(RAG)的最佳方法仅能达到 3.8%。本文探讨了 ACI 设计如何影响智能体的行为和性能,并提供了关于有效设计的见解。
主题/分类:
- 主要学科:软件工程 (cs.SE)
- 相关学科:人工智能 (cs.AI)、计算与语言 (cs.CL)、人机交互 (cs.HC)、机器学习 (cs.LG)
备注:
前两位作者贡献相同。代码和演示位于:https://swe-agent.com