SVQ 是由 Google 发布的一个多模态数据集,主要用于音频质量评估相关的研究与开发。
该数据集的核心用途是进行主观语音质量评估。它可用于训练或评估模型对语音音频质量进行预测和评分,在语音通信、音频编解码器优化、语音增强等领域有重要应用价值。
这是一个多模态数据集,包含以下三种数据类型:
* 音频:核心的语音样本数据。
* 文本:可能与音频对应的转录文本或评估相关的文本描述。
* 表格数据:可能包含音频的元信息、质量评分标签、评估者信息等结构化数据。
数据集规模较大,总计包含 676,306 行数据。