BoolQ 数据集简介
数据集概述
BoolQ(Boolean Questions)是一个由 Google 发布的大规模阅读理解问答数据集。其核心任务是判断给定一段文本(段落)后,能否对提出的问题给出“是”(Yes)或“否”(No)的答案。
主要用途
该数据集主要用于训练和评估模型在自然语言理解和阅读理解方面的能力,特别是针对需要复杂推理、从文本中寻找证据以回答二元问题的场景。
数据类型与特点
- 模态:纯文本。
- 数据形式:每个样本包含一个段落(Passage)和一个问题(Question),以及对应的答案(布尔值:True/False)。
- 特点:
- 问题通常无法直接从段落中通过简单的关键词匹配找到答案,需要模型进行一定程度的推理和理解。
- 段落来源多样,涵盖维基百科等多种领域,问题由人工标注者根据段落内容自然提出。
规模信息
- 样本数量:12,697 条(训练、验证、测试集总和,具体划分需参考官方文档)。
适用场景
- 模型训练:用于训练问答系统、阅读理解模型。
- 基准测试:作为评估模型自然语言理解能力的基准数据集之一。
- 研究领域:自然语言处理、机器学习、问答系统、可解释性AI(探究模型如何得出答案)。