数据集简介
VoxPopuli 是由 Facebook(现 Meta)发布的一个大规模多语言语音数据集,主要用于语音识别、机器翻译等语音和语言处理任务的研究与开发。
主要用途
- 自动语音识别 (ASR):训练和评估多语言语音识别模型。
- 机器翻译 (MT):支持语音到文本、文本到文本的翻译任务。
- 语音处理研究:为语音合成、语音理解等前沿研究提供数据支持。
数据类型/模态
- 音频:原始语音录音。
- 文本:与音频对应的转录文本及翻译文本。
规模与统计
- 数据量:包含超过 125 万条样本(音频-文本对)。
- 语言覆盖:涵盖多种欧洲语言,是一个大规模的多语言语料库。
使用场景
适用于需要大规模、真实场景、多语言语音数据的研究机构、高校或企业,用于构建或改进语音相关的AI模型。