数据集简介
由阿里巴巴-阿里云(Alibaba-Apsara)发布的一个用于提升模型推理能力的指令微调数据集。该数据集旨在通过高质量的指令-响应对,训练或优化大语言模型(特别是GPT风格的开源模型)的复杂推理能力。
主要用途
用于对大型语言模型(如120B参数规模的模型)进行监督微调(SFT),以增强其在多步骤推理、逻辑分析、问题解决等方面的能力。
数据类型与模态
- 模态:纯文本(text)
- 格式:JSON
- 规模:包含超过30万条数据样本(306,386行)
核心特点
- 聚焦推理能力:数据专门针对提升模型的“高级推理”(Superior Reasoning)技能设计。
- 大规模高质量:数据量达30万+,适用于训练百亿参数级别的大模型。
- 开源可用:非门控(gated)数据集,可直接下载使用。
- 适用性广:适用于基于GPT架构的开源大模型的微调与能力增强。
典型使用场景
- 训练或微调百亿参数大语言模型的推理模块。
- 作为构建具备更强逻辑推理和问题解决能力AI助手的数据基础。
- 用于学术研究或工业界开发更“聪明”的对话与问答模型。