数据集简介
微软发布的包含约 20 万条数学应用题(Word Problems)的数据集,主要用于训练和评估大语言模型在数学推理和问题解决方面的能力。
主要用途
- 训练语言模型进行数学推理
- 评估模型在解决数学文字问题上的性能
- 可作为数学问答(Math QA)任务的基准数据集
数据类型
- 模态:纯文本
- 格式:Parquet
- 规模:200,035 条样本
数据特点
- 专注于数学文字问题,涵盖多种数学概念和难度级别
- 数据量较大(20万+),适合大规模模型训练
- 由微软发布,具有一定的权威性和质量保证
使用场景
- 大语言模型的数学能力微调
- 数学推理研究的数据基准
- 教育科技领域的智能辅导系统开发