Rasa 是由 AI4Bharat 发布的一个多模态数据集,主要用于语音与文本相关的任务。该数据集包含约 99.5 万条样本,支持音频和文本两种模态。
适用于语音识别、语音合成、多模态学习等研究与应用场景。
可用于训练或评估涉及印度语言(或其他相关语言)的语音处理模型,支持多模态数据处理流程。