数据集简介
由 NVIDIA 发布的数学推理数据集,基于 GSM8K 数据集构建,专注于数学问题求解。
主要用途
用于训练和评估大型语言模型(LLMs)的数学推理与问题解决能力。
数据类型/模态
规模与统计信息
- 数据量:包含 7,473 条样本
- 下载量:76 次
- 点赞数:11
数据特性与场景
- 核心特点:该数据集对原始 GSM8K 数学问题中的关键数值信息进行了“掩码”处理,旨在引导模型专注于问题背后的逻辑推理过程,而非直接依赖具体数字进行计算。
- 适用场景:
- 训练语言模型进行抽象数学推理。
- 评估模型在脱离具体数值情况下的逻辑理解和分步解决问题的能力。
- 可作为数学推理任务的一个基准或补充训练数据。