distil-whisper/tedlium-long-form

首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

数据集简介

这是一个由 distil-whisper 发布的音频-文本数据集，主要用于长格式语音识别任务的研究与模型评估。

主要用途

该数据集旨在用于训练和测试自动语音识别（ASR）模型，特别是针对长篇幅、连续语音（如演讲、讲座）的识别场景。

数据类型/模态

模态：包含音频和文本两种数据类型。
内容：音频数据及其对应的转录文本。

规模与格式

数据量：包含 19 个样本（行）。
存储格式：数据以 Parquet 格式存储。
使用库：兼容 datasets、pandas、mlcroissant、polars 等常用数据处理库。

使用场景

适用于开发、微调或评估在 TED 演讲等类似长格式、高质量语音内容上表现更优的语音识别模型。

数据集地址：https://huggingface.co/datasets/distil-whisper/tedlium-long-form

64 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 10 ms

Developed with Cursor