由 OpenGVLab 团队发布的数据集,主要用于视觉与物理环境交互相关的任务。
该数据集旨在支持视觉与物理环境交互(V2PE)的研究与开发,可能涉及机器人操作、场景理解或具身智能等领域。
适用于需要结合视觉感知与物理环境交互的AI模型训练与评估,例如: - 机器人抓取与操作 - 增强现实/虚拟现实中的物理交互 - 自动驾驶中的场景理解与决策