OpenMOSS-Team/VideoThinkBench

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

数据集简介
VideoThinkBench 是一个由 OpenMOSS-Team 发布的多模态视频理解基准测试数据集。它旨在评估和促进模型在视频内容上的深度推理与思考能力。

主要用途
该数据集主要用于评测和训练视频理解模型，特别是那些需要结合视觉信息和文本描述进行复杂推理、问答或分析任务的模型。

数据类型/模态
* 模态：图像（视频帧）与文本。
* 数据集包含视频相关的视觉内容（以图像形式表示）和对应的文本信息（如问题、描述或标注）。

规模与统计信息
* 数据集包含 4,899 条样本。
* 下载量：833次。
* 点赞数：14次。

使用场景
适用于计算机视觉、多模态机器学习等领域的研究与开发，具体场景包括：
* 视频问答（VideoQA）
* 视频内容理解与描述
* 需要结合时序视觉信息和语言进行推理的模型训练与评估。

78 次点击 ∙ 0 人收藏

登录后收藏

0 条回复