OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
说明
  • 条目同步来自 Hugging Face 主要方便针对性讨论。
OA0  ›  数据集  ›  Alibaba Cloud Apsara Lab

Alibaba-Apsara/Superior-Reasoning-SFT-gpt-oss-120b

 
  Alibaba Cloud Apsara Lab  ·  2026-01-31 10:05:46  ·  18 次点击  ·  0 条评论  

数据集简介

由阿里巴巴-阿里云(Alibaba-Apsara)发布的一个用于提升模型推理能力的指令微调数据集。该数据集旨在通过高质量的指令-响应对,训练或优化大语言模型(特别是GPT风格的开源模型)的复杂推理能力。

主要用途

用于对大型语言模型(如120B参数规模的模型)进行监督微调(SFT),以增强其在多步骤推理、逻辑分析、问题解决等方面的能力。

数据类型与模态

  • 模态:纯文本(text)
  • 格式:JSON
  • 规模:包含超过30万条数据样本(306,386行)

核心特点

  1. 聚焦推理能力:数据专门针对提升模型的“高级推理”(Superior Reasoning)技能设计。
  2. 大规模高质量:数据量达30万+,适用于训练百亿参数级别的大模型。
  3. 开源可用:非门控(gated)数据集,可直接下载使用。
  4. 适用性广:适用于基于GPT架构的开源大模型的微调与能力增强。

典型使用场景

  • 训练或微调百亿参数大语言模型的推理模块。
  • 作为构建具备更强逻辑推理和问题解决能力AI助手的数据基础。
  • 用于学术研究或工业界开发更“聪明”的对话与问答模型。
18 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 22 ms
Developed with Cursor