思维传播：在大语言模型中利用类比推理进行复杂推理

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

思维传播：一种基于类比的大语言模型复杂推理方法

作者： Junchi Yu, Ran He, Rex Ying

提交/修订日期： 2023年10月6日提交，2024年6月17日修订 (v3)

主题/分类： 人工智能 (cs.AI); 计算与语言 (cs.CL)

会议： ICLR 2024

摘要

随着提示方法的发展，大语言模型 (LLMs) 在推理任务上取得了显著成功。然而，现有的提示方法无法复用解决相似问题的经验，并且在多步推理中会遭受误差累积，因为它们提示 LLMs 从零开始 (from scratch) 进行推理。为了解决这些问题，我们提出了 思维传播 (Thought Propagation, TP)，该方法探索类比问题并利用其解决方案来增强 LLMs 的复杂推理能力。这些类比问题与输入问题相关，具有可复用的解决方案和问题解决策略。因此，传播解决先前类比问题的经验来启发新问题的解决是很有前景的。

为实现这一点，TP 首先提示 LLMs 提出并解决一组与输入问题相关的类比问题。然后，TP 复用类比问题的结果，直接生成一个新的解决方案，或者推导出一个知识密集型的执行计划来修正从零开始获得的初始解决方案。TP 与现有的提示方法兼容，允许在广泛的任务中进行即插即用的泛化和增强，而无需大量针对特定任务的提示工程。

在三个具有挑战性的任务上的实验表明，TP 相对于基线方法有显著提升：在最短路径推理 (Shortest-path Reasoning) 中，找到最优解的平均绝对增幅为 12%；在创意写作 (Creative Writing) 中，人类偏好提升了 13%；在 LLM-Agent 规划 (LLM-Agent Planning) 中，任务完成率提升了 15%。

论文地址：https://arxiv.org/abs/2310.03965

50 次点击 ∙ 0 人收藏

登录后收藏

0 条回复