作者: Maciej Besta, Nils Blach, Ales Kubicek, Robert Gerstenberger, Lukas Gianinazzi, Joanna Gajda, Tomasz Lehmann, Michal Podstawski, Hubert Niewiadomski, Piotr Nyczyk, Torsten Hoefler
摘要: 本文介绍了思维图(Graph of Thoughts, GoT):一个将大型语言模型(LLM)的提示能力提升到超越思维链(Chain-of-Thought)或思维树(Tree of Thoughts, ToT)等范式的框架。GoT 的核心思想和主要优势在于能够将 LLM 生成的信息建模为一个任意的图,其中信息单元(“LLM 思维”)是顶点,边则对应这些顶点之间的依赖关系。这种方法使得将任意的 LLM 思维组合成协同结果、提炼整个思维网络的精髓,或利用反馈循环增强思维成为可能。我们展示了 GoT 在不同任务上相比现有技术具有优势,例如,在排序任务上,其质量比 ToT 提高了 62%,同时成本降低了 >31%。我们确保 GoT 可以通过新的思维转换进行扩展,因此可用于引领新的提示方案。这项工作使 LLM 推理更接近人类思维或大脑机制(如循环),这两者都形成了复杂的网络。
主题/分类:
- 主要: 计算与语言 (cs.CL)
- 其他: 人工智能 (cs.AI); 机器学习 (cs.LG)
提交/修订历史:
- 提交于 2023年8月18日 (v1)
- 修订于 2023年8月21日 (此版本, v2)
- 最新版本于 2024年2月6日 (v4)