纠正性检索增强生成 (Corrective Retrieval Augmented Generation)

标题

Corrective Retrieval Augmented Generation

作者

Shi-Qi Yan, Jia-Chen Gu, Yun Zhu, Zhen-Hua Ling

摘要

大型语言模型（LLMs）不可避免地会产生幻觉，因为仅凭其封装的参数化知识无法确保生成文本的准确性。虽然检索增强生成（RAG）是对LLMs的一种实用补充，但它高度依赖于检索文档的相关性，这引发了关于当检索出错时模型如何行为的问题。为此，我们提出了纠正性检索增强生成（CRAG）以提高生成的鲁棒性。具体来说，我们设计了一个轻量级的检索评估器来评估针对查询所检索文档的整体质量，返回一个置信度分数，基于此可以触发不同的知识检索动作。由于从静态且有限的语料库中检索只能返回次优文档，我们利用大规模网络搜索作为扩展来增强检索结果。此外，我们设计了一种“分解-重组”算法，用于有选择地聚焦检索文档中的关键信息并过滤掉其中的无关信息。CRAG即插即用，可以无缝地与各种基于RAG的方法结合使用。在覆盖短文本和长文本生成任务的四个数据集上的实验表明，CRAG可以显著提升基于RAG的方法的性能。

主题/分类

主分类：计算机科学 - 计算与语言 (Computation and Language, cs.CL)

其他信息

提交日期：2024年1月29日（v1），最新修订于2024年10月7日（v3）
论文ID：arXiv:2401.15884
评论：更新了结果，增加了更多分析，并修复了排版错误

论文地址：https://arxiv.org/abs/2401.15884

14 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

Corrective RAG：通过纠错式检索流程提升 RAG 可靠性

纠正性检索增强生成 (Corrective Retrieval Augmented Generation)

标题

作者

摘要

主题/分类

其他信息