作者: Shunyu Yao, Dian Yu, Jeffrey Zhao, Izhak Shafran, Thomas L. Griffiths, Yuan Cao, Karthik Narasimhan
提交/修订日期: 2023年5月17日提交,2023年12月3日修订(v2)
主题/分类: Computation and Language (cs.CL); Artificial Intelligence (cs.AI); Machine Learning (cs.LG)
摘要:
语言模型正被广泛应用于各种任务中的通用问题解决,但其在推理过程中仍局限于基于词元的、从左到右的决策过程。这意味着它们在需要探索、战略前瞻或初始决策起关键作用的任务中可能表现不佳。为了克服这些挑战,我们引入了一种新的语言模型推理框架——思维树(Tree of Thoughts, ToT)。该框架推广了流行的思维链(Chain of Thought)提示方法,允许对作为问题解决中间步骤的连贯文本单元(“思维”)进行探索。ToT使语言模型能够通过考虑多种不同的推理路径、自我评估选择来决定下一步行动,并在必要时进行前瞻或回溯以做出全局决策,从而进行审慎的决策。我们的实验表明,ToT在三个需要非平凡规划或搜索的新任务上显著增强了语言模型的问题解决能力:24点游戏、创意写作和迷你填字游戏。例如,在24点游戏中,使用思维链提示的GPT-4仅解决了4%的任务,而我们的方法达到了74%的成功率。
代码仓库: https://github.com/princeton-nlp/tree-of-thought-llm
备注: 此为NeurIPS 2023最终版本。