数据集简介
Tarteel AI 的 TLOG 数据集是一个包含音频和文本模态的公开数据集,主要用于语音和文本相关的机器学习任务。
主要用途
该数据集适用于语音识别、音频处理、文本分析以及跨模态(音频-文本)学习等研究与应用场景。
数据类型/模态
- 音频:包含语音音频数据。
- 文本:包含与音频对应的文本数据。
规模与统计信息
- 数据总行数:719,853 条。
- 下载量:162 次。
- 点赞数:6 个。
使用场景
- 训练和评估自动语音识别(ASR)模型。
- 进行音频特征提取与分析。
- 开发语音到文本或文本到语音的应用。
- 支持多模态机器学习研究。