BAAI/CI-VID 是由北京智源人工智能研究院(BAAI)发布的一个数据集,主要用于视频内容理解和相关研究。
该数据集旨在支持视频内容分析、视频文本描述生成、跨模态检索等任务的研究与开发。
适用于自然语言处理、计算机视觉以及多模态学习领域的研究者与开发者,可用于训练和评估视频描述生成、视频问答、视频内容检索等模型。