Emolia 是一个由 LAION 组织发布的大规模多模态数据集,专注于音频与文本的配对数据。
该数据集主要用于训练和评估涉及音频与文本关联的模型,例如: * 语音识别 * 音频描述生成 * 多模态(音频-文本)学习研究
适用于需要大规模音频-文本对进行模型预训练、微调或基准测试的研究与开发项目。其开源(非门控)特性便于学术和工业界使用。