数据集简介
该数据集由 galaxyMindAiLabs 发布,专注于 STEM(科学、技术、工程、数学)领域的复杂推理任务。它旨在为 AI 模型提供高质量的文本数据,以训练和评估其在复杂科学问题上的推理能力。
主要用途
- 训练或微调语言模型在 STEM 领域的复杂推理能力。
- 评估模型解决多步骤、逻辑严谨的科学与数学问题的性能。
- 可用于研究 AI 在科学教育、自动解题等场景的应用。
数据类型与规模
- 模态:纯文本。
- 规模:包含约 11.8 万条数据记录。
- 格式:数据集以 Parquet 格式存储,便于高效处理。
数据特点
- 数据内容聚焦于需要多步逻辑推理的 STEM 问题,可能涵盖数学推导、物理原理应用、工程问题分析等复杂场景。
- 数据集非门控(公开可访问),已获得一定社区关注(下载量 500+,点赞数 65)。