数据集简介
该数据集由 arcee-ai 发布,包含 DeepSeek-DCLM 模型生成的 logits 数据,并经过打包处理,序列长度为 8192。
主要用途
适用于模型蒸馏、知识迁移、logits 分析等任务,可用于训练或优化其他语言模型。
数据类型/模态
- 数据格式:Parquet
- 数据类型:模型 logits(经过打包处理)
- 模态:文本相关(语言模型输出)
规模与统计
- 数据行数:158,859 行
- 下载量:6,854 次
- 点赞数:4
使用场景
- 模型蒸馏:利用 logits 训练轻量级模型
- 研究分析:分析模型预测分布特性
- 训练辅助:作为辅助数据用于模型优化