DROID 是一个大规模、多模态的机器人操作数据集,旨在为机器人学习研究提供丰富的真实世界交互数据。
该数据集主要用于训练和评估机器人操作策略、模仿学习、强化学习以及多模态感知与控制模型。
数据集包含三种主要模态: * 视频数据:记录机器人执行任务时的视觉观察。 * 文本数据:可能包含任务指令、动作描述或场景标注。 * 表格数据:存储机器人状态、动作指令、传感器读数等结构化信息。
数据集规模庞大,包含超过 2546 万行 数据记录,为模型训练提供了充足的数据量。