Swallow-Math 数据集简介
数据集概述
Swallow-Math 是一个由东京工业大学(TokyoTech)LLM团队创建的大规模数学问题数据集,包含超过430万条文本数据。
主要用途
该数据集主要用于训练和评估大型语言模型(LLM)在数学领域的理解和推理能力。
数据类型与特点
- 模态类型:纯文本格式
- 数据格式:JSON
- 数据规模:432.6万行数据
- 开放程度:公开可用,无需特殊权限
使用场景
- 数学问题求解模型的训练
- 数学推理能力的基准测试
- 教育技术领域的应用开发
- 学术研究中的数学语言理解任务
统计信息
- 下载量:1,743次
- 点赞数:42次
- 最后更新:2026年3月
该数据集以其大规模、高质量的数学问题集合为特色,适合需要大量数学文本数据的机器学习项目。