DeepSeek-MixedModeReasoning-Logits-Packed-16384 数据集简介
数据集概述
这是一个由 arcee-ai 发布的推理相关数据集,专门用于支持混合模式推理任务。数据集包含大量经过处理的模型输出信息。
主要特性
- 数据类型:包含模型推理过程中的 logits 信息(模型输出层的原始分数)
- 数据格式:采用高效的 Parquet 格式存储
- 数据规模:包含 352,965 行数据
- 处理方式:数据经过打包处理,序列长度达到 16384
适用场景
- 模型推理过程分析与研究
- 混合模式推理任务训练
- 模型输出层特征提取与处理
- 大规模序列数据处理实验
技术特点
- 支持多种数据处理库(datasets, dask, mlcroissant, polars)
- 公开可访问,无需特殊权限
- 下载量较高(2,909次),表明在相关研究领域有一定影响力
该数据集适合需要进行深度模型推理分析、序列数据处理或混合模式推理研究的开发者和研究人员使用。