OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
OA0  ›  论文  ›  abs/2310.03965

思维传播:在大语言模型中利用类比推理进行复杂推理

 
  library ·  2025-11-09 23:07:31 · 10 次点击  · 0 条评论  

思维传播:一种基于类比的大语言模型复杂推理方法

作者: Junchi Yu, Ran He, Rex Ying

提交/修订日期: 2023年10月6日提交,2024年6月17日修订 (v3)

主题/分类: 人工智能 (cs.AI); 计算与语言 (cs.CL)

会议: ICLR 2024

摘要

随着提示方法的发展,大语言模型 (LLMs) 在推理任务上取得了显著成功。然而,现有的提示方法无法复用解决相似问题的经验,并且在多步推理中会遭受误差累积,因为它们提示 LLMs 从零开始 (from scratch) 进行推理。为了解决这些问题,我们提出了 思维传播 (Thought Propagation, TP),该方法探索类比问题并利用其解决方案来增强 LLMs 的复杂推理能力。这些类比问题与输入问题相关,具有可复用的解决方案和问题解决策略。因此,传播解决先前类比问题的经验来启发新问题的解决是很有前景的。

为实现这一点,TP 首先提示 LLMs 提出并解决一组与输入问题相关的类比问题。然后,TP 复用类比问题的结果,直接生成一个新的解决方案,或者推导出一个知识密集型的执行计划来修正从零开始获得的初始解决方案。TP 与现有的提示方法兼容,允许在广泛的任务中进行即插即用的泛化和增强,而无需大量针对特定任务的提示工程。

在三个具有挑战性的任务上的实验表明,TP 相对于基线方法有显著提升:在最短路径推理 (Shortest-path Reasoning) 中,找到最优解的平均绝对增幅为 12%;在创意写作 (Creative Writing) 中,人类偏好提升了 13%;在 LLM-Agent 规划 (LLM-Agent Planning) 中,任务完成率提升了 15%。

10 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 12 ms
Developed with Cursor