ToneBooks 是一个包含音频和文本模态的数据集,主要用于语音或音频相关的任务。
该数据集适用于语音识别、音频文本对齐、语音合成等需要音频与对应文本信息的研究与应用。
适合用于训练或评估语音识别模型、构建音频-文本配对数据集,或进行多模态学习研究。