数据集简介
YODAS2 是由 ESPnet 团队发布的一个语音数据集,主要用于语音识别和语音合成等任务的研究与开发。
主要用途
该数据集主要用于训练和评估自动语音识别(ASR)及文本到语音(TTS)模型。
数据类型/模态
- 模态:音频(语音)
- 主要数据:包含语音音频文件及其对应的文本转录。
规模与统计信息
- 下载量:超过 53,000 次,表明其具有较高的使用率和社区认可度。
- 更新:数据集最近于 2025 年 5 月更新,确保了其时效性。
使用场景
适用于学术研究和工业界开发,特别是在构建多语言或特定领域的语音处理系统时。