VPData 是由腾讯 ARC 团队发布的数据集,主要用于视频处理相关的研究与开发。
该数据集旨在支持涉及视频内容分析、理解或生成的任务,例如视频标注、视频描述生成或视频内容的结构化分析。
数据集包含三种主要模态的数据:
* 视频 (Video): 原始或处理过的视频内容。
* 文本 (Text): 与视频内容相关的文本信息,如描述、标签或元数据。
* 表格 (Tabular): 结构化的数据,可能包含视频特征、统计信息或其他属性。
数据集规模较大,总计包含 392,077 行 数据,以 CSV 格式存储。
适用于计算机视觉、多模态学习、视频内容分析等领域的研究人员和开发者,可用于训练或评估视频理解、视频到文本生成等模型。