SpeechBrain 团队发布的 Common Language 数据集,是一个用于语音处理任务的公开数据集。
该数据集主要用于训练和评估与语言相关的语音处理模型,例如语音识别、语言识别或相关的多语言语音任务。
数据集包含音频数据,其核心模态为语音。
适用于研究人员和开发者进行以下工作: - 开发或测试多语言语音识别系统。 - 进行语言识别(LID)相关的模型训练与评估。 - 作为语音处理领域的基准数据集之一。