数据集简介
GSM8K 是一个由 OpenAI 发布的高质量数学问题求解数据集,主要用于评估和训练模型解决小学数学应用题的能力。
主要用途
- 模型基准测试:作为评估语言模型数学推理能力的标准基准数据集。
- 数学推理训练:用于训练模型进行多步骤的数学问题求解。
数据类型与模态
- 模态:纯文本
- 内容:包含问题描述、多步骤推理过程和最终答案。
规模与统计
- 数据量:17,584 条样本
- 下载量:超过 46.5 万次
- 社区认可:获得 1,173 次点赞
使用场景
适用于自然语言处理、教育技术、自动解题系统等领域的研究与开发,特别适合测试模型在复杂、多步骤数学推理任务上的性能。