NVIDIA Nemotron-Personas-India 数据集
数据集简介
由 NVIDIA 发布的一个多模态数据集,专注于印度地区的人物形象(Personas)数据。
主要用途
可用于训练或评估多模态模型,特别是在生成或理解与印度人物相关的图像和文本内容方面。
数据类型/模态
- 图像:包含人物相关的视觉数据。
- 文本:包含与人物相关的描述性或上下文文本信息。
数据规模
- 数据总行数:3,000,000 条记录。
- 数据格式:支持 Parquet 和 Optimized-Parquet 格式,便于高效处理。
使用场景
适用于计算机视觉、多模态 AI、内容生成等研究和应用领域,尤其适合需要印度文化或人物特征数据的项目。