OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
说明
  • 条目同步来自 Hugging Face 主要方便针对性讨论。
OA0  ›  数据集  ›  Arcee AI

arcee-ai/LLama-405B-Logits

 
  Arcee AI  ·  2024-11-29 19:09:43  ·  23 次点击  ·  0 条评论  

数据集简介

该数据集包含了由 Llama 3 405B 模型生成的 logits 数据,主要用于模型输出概率分布的分析和研究。

主要用途

  • 模型行为分析:研究大型语言模型(LLama 405B)在特定输入下的输出偏好和概率分布。
  • 知识蒸馏与模型压缩:可作为教师模型的输出,用于训练更小的学生模型。
  • 可解释性研究:分析模型内部决策过程,理解其预测的置信度。

数据类型与规模

  • 数据类型:模型 logits(原始输出分数,未经 softmax 归一化)。
  • 数据规模:包含 10,000 行数据。
  • 存储格式:Parquet 格式,支持使用 datasets、dask、polars 等库高效读取。

使用场景

适用于机器学习研究者、数据科学家,特别是那些专注于大型语言模型分析、模型蒸馏和可解释性 AI 的领域。

23 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor