OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
说明
  • 条目同步来自 Hugging Face 主要方便针对性讨论。
OA0  ›  数据集  ›  Whisper Distillation

distil-whisper/peoples_speech-clean

 
  Whisper Distillation  ·  2023-09-25 10:30:13  ·  22 次点击  ·  0 条评论  

数据集简介

这是一个由 distil-whisper 发布的语音数据集,名为 peoples_speech-clean。它是从原始 People's Speech 数据集中提取并经过清理的版本。

主要用途

该数据集主要用于语音识别(ASR)模型的训练与评估,特别是为构建更高效、更精确的语音转文本模型提供高质量的语音-文本对数据。

数据类型/模态

  • 模态:音频(语音)
  • 数据形式:语音片段及其对应的转录文本(文本标签)。

核心特点

  1. 高质量与清洁度:作为“clean”版本,它很可能经过了严格的数据过滤和预处理,去除了噪声大、质量差或转录不准确的样本,旨在提供更可靠、更干净的训练数据。
  2. 适用于模型蒸馏:由 distil-whisper 发布,暗示该数据集可能特别适用于知识蒸馏场景,即用于训练更轻量、更高效的 Whisper 语音识别模型变体。
  3. 易于获取:数据集未设置访问门控(gated: false),可以公开下载和使用。

使用场景

  • 训练或微调开箱即用的语音识别模型。
  • 进行语音识别模型的基准测试和性能评估。
  • 用于模型压缩与蒸馏研究,构建更小、更快的ASR模型。
22 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 17 ms
Developed with Cursor