作者: Guanzhi Wang, Yuqi Xie, Yunfan Jiang, Ajay Mandlekar, Chaowei Xiao, Yuke Zhu, Linxi Fan, Anima Anandkumar
提交/修订日期: 2023年5月25日提交,2023年10月19日修订 (v2)
主题/分类: 人工智能 (cs.AI); 机器学习 (cs.LG)
摘要:
本文介绍了Voyager,这是首个在《我的世界》(Minecraft) 中由大语言模型驱动的具身终身学习智能体。它能够在无需人类干预的情况下,持续探索世界、获取多样技能并做出新发现。Voyager由三个关键组件构成:1) 一个最大化探索的自动课程;2) 一个用于存储和检索复杂行为的、可执行代码的不断增长的技能库;3) 一种新的迭代提示机制,该机制结合了环境反馈、执行错误和自我验证以改进程序。Voyager通过黑盒查询与GPT-4交互,无需对模型参数进行微调。Voyager开发的技能具有时间扩展性、可解释性和组合性,这使其能力能够快速复合,并减轻了灾难性遗忘。实验表明,Voyager展现出强大的上下文内终身学习能力,并在玩《我的世界》方面表现出卓越的熟练度。与之前的SOTA方法相比,它获得了3.3倍多的独特物品,行进了2.3倍长的距离,并以高达15.3倍的速度解锁了关键的科技树里程碑。Voyager能够在一个新的《我的世界》世界中利用已学习的技能库从头开始解决新任务,而其他技术则难以泛化。我们在 https://voyager.minedojo.org/ 开源了完整的代码库和提示。
项目链接: 项目网站与开源代码库:https://voyager.minedojo.org/