Alibaba-Apsara/Superior-Reasoning-SFT-gpt-oss-120b

首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

数据集简介

由阿里巴巴-阿里云（Alibaba-Apsara）发布的一个用于提升模型推理能力的指令微调数据集。该数据集旨在通过高质量的指令-响应对，训练或优化大语言模型（特别是GPT风格的开源模型）的复杂推理能力。

主要用途

用于对大型语言模型（如120B参数规模的模型）进行监督微调（SFT），以增强其在多步骤推理、逻辑分析、问题解决等方面的能力。

数据类型与模态

模态：纯文本（text）
格式：JSON
规模：包含超过30万条数据样本（306,386行）

核心特点

聚焦推理能力：数据专门针对提升模型的“高级推理”（Superior Reasoning）技能设计。
大规模高质量：数据量达30万+，适用于训练百亿参数级别的大模型。
开源可用：非门控（gated）数据集，可直接下载使用。
适用性广：适用于基于GPT架构的开源大模型的微调与能力增强。

典型使用场景

训练或微调百亿参数大语言模型的推理模块。
作为构建具备更强逻辑推理和问题解决能力AI助手的数据基础。
用于学术研究或工业界开发更“聪明”的对话与问答模型。

数据集地址：https://huggingface.co/datasets/Alibaba-Apsara/Superior-Reasoning-SFT-gpt-oss-120b

61 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 14 ms

Developed with Cursor