Corrective Retrieval Augmented Generation
Shi-Qi Yan, Jia-Chen Gu, Yun Zhu, Zhen-Hua Ling
大型语言模型(LLMs)不可避免地会产生幻觉,因为仅凭其封装的参数化知识无法确保生成文本的准确性。虽然检索增强生成(RAG)是对LLMs的一种实用补充,但它高度依赖于检索文档的相关性,这引发了关于当检索出错时模型如何行为的问题。为此,我们提出了纠正性检索增强生成(CRAG)以提高生成的鲁棒性。具体来说,我们设计了一个轻量级的检索评估器来评估针对查询所检索文档的整体质量,返回一个置信度分数,基于此可以触发不同的知识检索动作。由于从静态且有限的语料库中检索只能返回次优文档,我们利用大规模网络搜索作为扩展来增强检索结果。此外,我们设计了一种“分解-重组”算法,用于有选择地聚焦检索文档中的关键信息并过滤掉其中的无关信息。CRAG即插即用,可以无缝地与各种基于RAG的方法结合使用。在覆盖短文本和长文本生成任务的四个数据集上的实验表明,CRAG可以显著提升基于RAG的方法的性能。