作者: Maciej Besta, Nils Blach, Ales Kubicek, Robert Gerstenberger, Michal Podstawski, Lukas Gianinazzi, Joanna Gajda, Tomasz Lehmann, Hubert Niewiadomski, Piotr Nyczyk, Torsten Hoefler
摘要:
本文提出了思维图(Graph of Thoughts,GoT)框架,旨在将大语言模型(LLM)的提示能力提升到超越思维链(Chain-of-Thought)或思维树(Tree of Thoughts, ToT)等现有范式的新高度。GoT的核心思想与主要优势在于能够将LLM生成的信息建模为任意图结构,其中信息单元(“LLM思维”)作为顶点,边则对应这些顶点之间的依赖关系。这种方法能够将任意的LLM思维组合成协同的结果,提炼整个思维网络的精华,或利用反馈循环增强思维。我们展示了GoT在不同任务上相较于现有技术具有优势,例如在排序任务上,其质量比ToT提高了62%,同时成本降低了超过31%。我们确保GoT可以通过新的思维转换进行扩展,从而可用于引领新的提示方案。这项工作使LLM推理更接近人类思维或大脑机制(如循环),这两者都形成复杂的网络。
主题/分类:
- 计算与语言(cs.CL)
- 人工智能(cs.AI)
- 机器学习(cs.LG)
提交/修订日期: 2023年8月18日提交,2024年2月6日修订(当前版本v4)
期刊参考: Proceedings of the AAAI Conference on Artificial Intelligence 2024 (AAAI'24)
arXiv ID: arXiv:2308.09687