数据集简介
该数据集由 Facebook 发布,是 KILT(Knowledge Intensive Language Tasks)基准的一部分,基于维基百科构建,旨在支持知识密集型语言任务的研究与评估。
主要用途
用于训练和评估需要外部知识(如维基百科)的 NLP 模型,例如开放域问答、实体链接、事实核查、对话生成等任务。
数据类型/模态
- 模态:文本
- 内容:维基百科文章的结构化版本,包含标题、段落、实体标注等,通常与知识密集型任务(如问答、事实验证)的查询和答案配对。
规模或统计信息
- 下载量:353 次
- 点赞数:19
- 更新日期:2024年1月
使用场景
- 开发需要检索或验证外部知识的 NLP 模型。
- 作为基准数据集,用于比较不同模型在知识密集型任务上的性能。
- 适用于学术研究或工业界构建需要事实准确性的语言应用。