这是一个由 distil-whisper 发布的音频-文本数据集,主要用于语音识别模型的训练与评估。
distil-whisper
该数据集的核心用途是支持自动语音识别(ASR)任务,特别是为 distil-whisper 这类模型提供训练或验证数据。
适用于需要较小规模、高质量的音频-文本配对数据的场景,例如: * 语音识别模型的微调或测试。 * 语音处理相关的研究或教学示例。