```markdown
Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering
- 作者: Gautier Izacard, Edouard Grave
- 提交日期: 2020-07-02(v1),最后修订于 2021-02-03(v2)
- 分类: Computer Science > Computation and Language (cs.CL);Machine Learning (cs.LG)
摘要
在开放域问答任务中,生成式模型已被证明可以在不使用外部知识的情况下取得有竞争力的表现。然而,这种方法需要依赖包含数十亿参数的模型,训练和查询成本高昂。本文研究了这类模型如何从检索可能包含证据的文本段落中获益。作者在 Natural Questions 和 TriviaQA 开放基准测试上取得了当时最先进的结果。有趣的是,他们发现增加检索到的段落数量会显著提升该方法的性能,这表明生成式模型擅长从多个段落中聚合和组合证据。