数据集简介
该数据集包含了由 Llama 3 405B 模型生成的 logits 数据,主要用于模型输出概率分布的分析和研究。
主要用途
- 模型行为分析:研究大型语言模型(LLama 405B)在特定输入下的输出偏好和概率分布。
- 知识蒸馏与模型压缩:可作为教师模型的输出,用于训练更小的学生模型。
- 可解释性研究:分析模型内部决策过程,理解其预测的置信度。
数据类型与规模
- 数据类型:模型 logits(原始输出分数,未经 softmax 归一化)。
- 数据规模:包含 10,000 行数据。
- 存储格式:Parquet 格式,支持使用 datasets、dask、polars 等库高效读取。
使用场景
适用于机器学习研究者、数据科学家,特别是那些专注于大型语言模型分析、模型蒸馏和可解释性 AI 的领域。