Cosmos QA 数据集简介
Cosmos QA 是一个用于机器阅读理解(MRC)的数据集,专注于常识推理。它要求模型基于给定的上下文段落,理解其中隐含的常识和因果关系,从而回答相关问题。
主要用途
- 训练和评估需要常识推理能力的自然语言处理模型。
- 推动机器在理解文本深层含义和逻辑关系方面的研究。
数据类型/模态
- 模态:纯文本。
- 数据形式:每个样本包含一个上下文段落、一个相关问题以及四个候选答案(多选一)。正确答案需要结合段落中未明确陈述的常识进行推断。
核心特点
- 焦点明确:不同于仅从原文找答案的阅读理解任务,它强调对上下文逻辑和常识的推理。
- 挑战性高:问题无法通过简单的文本匹配回答,需要模型具备一定的世界知识和对因果关系的理解能力。
适用场景
- 开发更智能的问答系统和对话助手。
- 作为基准测试,衡量模型的常识推理水平。