数据集简介 该数据集由 HuggingFaceTB 发布,是一个用于数学推理任务的大规模文本/表格数据集,包含超过 4800 万行数据。
主要用途 适用于数学问题求解、逻辑推理、代码生成等任务的模型训练与微调。
数据类型/模态 - 模态:文本(text)与表格(tabular)混合 - 格式:Parquet - 规模:约 4828 万行
使用场景 - 数学题解与推理模型开发 - 教育类 AI 应用的数据支持 - 多模态(文本+结构化数据)任务研究