MotionMillion 数据集简介
概述
MotionMillion 是一个由 InternRobotics 发布的大规模多模态数据集,专注于机器人或智能体运动相关的视觉与语言数据。
主要用途
- 用于训练和评估机器人运动理解、生成或规划的模型。
- 适用于视觉-语言对齐任务,特别是与动作、姿态或运动序列相关的场景。
数据类型与模态
- 模态:图像、文本。
- 格式:数据以 WebDataset 格式存储,便于高效流式加载和处理。
数据规模
- 包含超过 125 万条数据样本(行)。
- 数据量庞大,适合训练需要大量数据的大规模模型。
适用场景
- 机器人学习:如从观察中学习动作、运动指令理解。
- 多模态学习:结合图像和文本信息进行跨模态表示学习。
- 生成任务:根据文本描述生成对应的运动序列或场景图像。