SPRINGLab/IndicTTS_Kannada

首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

数据集简介

这是一个用于卡纳达语（Kannada）文本转语音（TTS）任务的数据集，由SPRINGLab发布。它包含了卡纳达语的音频及其对应的文本转录，旨在支持卡纳达语语音合成模型的训练与评估。

主要用途

该数据集主要用于开发和训练针对卡纳达语的文本转语音（TTS）系统，也可用于相关的语音技术研究，如语音合成、语音识别（ASR）或语言模型预训练。

数据类型/模态

模态：音频（Audio）和文本（Text）
数据格式：音频文件（具体格式未在元数据中明确，通常为WAV等格式）和对应的文本转录。
存储格式：数据集以Parquet格式提供。

规模与统计信息

数据条数：9,694条（即音频-文本对的数量）。
下载量：178次。
点赞数：4次。

使用场景

学术研究：用于卡纳达语语音合成、多语言TTS模型的研究。
技术开发：为构建卡纳达语语音助手、有声读物生成、语音导航等应用提供训练数据。
语言资源：作为卡纳达语这一特定语言的有声语料库，可用于语言学分析或教育资源开发。

特点

语言特定：专注于印度主要语言之一的卡纳达语，填补了特定语言TTS数据资源的空白。
音频-文本对齐：提供了成对的音频和文本，是训练TTS模型的理想数据形式。
开源可访问：数据集非私有（private: false），可供研究人员和开发者公开下载使用。

数据集地址：https://huggingface.co/datasets/SPRINGLab/IndicTTS_Kannada

64 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 12 ms

Developed with Cursor