这是一个由 distil-whisper 发布的音频-文本数据集,主要用于长格式语音识别任务的研究与模型评估。
distil-whisper
该数据集旨在用于训练和测试自动语音识别(ASR)模型,特别是针对长篇幅、连续语音(如演讲、讲座)的识别场景。
datasets
pandas
mlcroissant
polars
适用于开发、微调或评估在 TED 演讲等类似长格式、高质量语音内容上表现更优的语音识别模型。