数据集简介
这是一个由 Neuphonic 发布的英文语音编码(Neural Codec)数据集,主要用于语音合成和音频处理领域的研究与开发。
主要用途
- 训练或微调神经编解码器(Neural Codec)模型
- 语音合成(TTS)系统的开发
- 音频表示学习与压缩
数据类型/模态
- 主要模态:表格数据(Tabular)
- 辅助模态:文本(Text)
- 数据以 Parquet 格式存储,便于高效处理与分析
规模与统计信息
- 数据行数:约 3059 万行
- 下载量:251 次
- 社区点赞数:16
使用场景
- 为语音生成模型提供高质量的音频编码训练数据
- 支持基于神经编解码器的实时语音合成应用
- 适用于需要大规模、结构化音频编码数据的研究项目