数据集简介
ATOMIC 是由 AllenAI 发布的一个常识知识图谱数据集。它旨在帮助机器理解和推理日常事件之间的因果关系、前提条件和人物意图等常识关系。
主要用途
- 常识推理:训练或评估模型对事件间隐含关系的理解能力。
- 自然语言生成:为生成更符合逻辑和常识的文本提供知识支持。
- 知识图谱构建:作为结构化常识知识的来源。
数据类型/模态
- 模态:纯文本(结构化知识对)
- 格式:事件-关系-属性三元组形式,例如给定一个事件(如“X 去超市”),提供其可能的原因、结果、人物属性等。
规模与统计
- 包含约 88 万 个常识知识三元组。
- 覆盖 9 种 关系类型,包括事件的原因(xReason)、结果(xEffect)、人物意图(xIntent)等。
使用场景
- 可用于训练常识推理模型(如用于问答、故事生成)。
- 作为下游 NLP 任务的辅助知识库。
- 研究人机交互中基于常识的对话与决策。