OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
说明
  • 条目同步来自 Hugging Face 主要方便针对性讨论。
OA0  ›  数据集  ›  SPRINGLab

SPRINGLab/IndicTTS_Kannada

 
  SPRINGLab  ·  2025-01-25 05:52:49  ·  23 次点击  ·  0 条评论  

数据集简介

这是一个用于卡纳达语(Kannada)文本转语音(TTS)任务的数据集,由SPRINGLab发布。它包含了卡纳达语的音频及其对应的文本转录,旨在支持卡纳达语语音合成模型的训练与评估。

主要用途

该数据集主要用于开发和训练针对卡纳达语的文本转语音(TTS)系统,也可用于相关的语音技术研究,如语音合成、语音识别(ASR)或语言模型预训练。

数据类型/模态

  • 模态:音频(Audio)和文本(Text)
  • 数据格式:音频文件(具体格式未在元数据中明确,通常为WAV等格式)和对应的文本转录。
  • 存储格式:数据集以Parquet格式提供。

规模与统计信息

  • 数据条数:9,694条(即音频-文本对的数量)。
  • 下载量:178次。
  • 点赞数:4次。

使用场景

  • 学术研究:用于卡纳达语语音合成、多语言TTS模型的研究。
  • 技术开发:为构建卡纳达语语音助手、有声读物生成、语音导航等应用提供训练数据。
  • 语言资源:作为卡纳达语这一特定语言的有声语料库,可用于语言学分析或教育资源开发。

特点

  • 语言特定:专注于印度主要语言之一的卡纳达语,填补了特定语言TTS数据资源的空白。
  • 音频-文本对齐:提供了成对的音频和文本,是训练TTS模型的理想数据形式。
  • 开源可访问:数据集非私有(private: false),可供研究人员和开发者公开下载使用。
23 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 13 ms
Developed with Cursor