Chain-of-Verification Reduces Hallucination in Large Language Models

作者： Shehzaad Dhuliawala, Mojtaba Komeili, Jing Xu, Roberta Raileanu, Xian Li, Asli Celikyilmaz, Jason Weston

提交/修订日期： 2023年9月20日提交，2023年9月25日修订 (v2)

摘要： 生成看似合理但事实错误的信息，即“幻觉”，是大语言模型中一个尚未解决的问题。本文研究了语言模型通过对其给出的回答进行深思熟虑以纠正错误的能力。我们提出了“验证链”（Chain-of-Verification, CoVe）方法，该方法要求模型首先 (i) 草拟一个初始回答；然后 (ii) 规划一系列用于事实核查其草稿的验证问题；(iii) 独立地回答这些问题，以确保答案不受其他回答的偏见影响；最后 (iv) 生成经过验证的最终回答。实验表明，CoVe 方法在多种任务上均能减少幻觉，包括来自 Wikidata 的基于列表的问题、闭卷 MultiSpanQA 以及长文本生成任务。

主题分类：
- 主要：计算与语言 (cs.CL)
- 交叉：人工智能 (cs.AI)

arXiv ID： arXiv:2309.11495

论文地址：https://arxiv.org/abs/2309.11495

54 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

Chain-of-Verification：先生成再验证，降低幻觉并提升可靠性

Chain-of-Verification Reduces Hallucination in Large Language Models