数据集简介
NVIDIA 发布的 OpenScienceReasoning-2 是一个用于科学推理的大规模文本数据集,旨在支持 AI 模型在科学领域的逻辑推理和问题解决能力训练。
主要用途
- 训练和评估 AI 模型在科学领域的推理能力
- 支持科学问答、逻辑推理、多步骤问题求解等任务
数据类型与模态
- 模态:纯文本
- 格式:Parquet
- 支持库:Datasets、Pandas、MLCroissant、Polars
数据规模
- 样本数量:802,666 行数据
- 下载量:327 次
- 受欢迎度:53 个点赞
使用场景
- 科学教育 AI 助手开发
- 研究型 AI 系统的推理能力训练
- 学术领域的自动问答系统构建
- 多步骤科学问题求解模型评估