数据集简介
这是一个用于机器人学习的数据集,专注于多任务操作场景,以图像和任务描述作为主要输入。
主要用途
用于训练和评估机器人视觉-语言模型,使其能够理解和执行基于自然语言指令的复杂操作任务。
数据类型/模态
- 图像:机器人操作过程中的视觉观察数据。
- 文本:与每个操作任务对应的自然语言描述或指令。
- 时序数据:记录了机器人状态随时间变化的序列信息。
- 表格数据:以结构化形式存储的元数据或状态信息。
规模与统计
- 总数据行数:约 13.86 万 行。
- 数据格式:Parquet。
- 支持的处理库:Datasets、Dask、Polars、ML Croissant。
使用场景
适用于机器人模仿学习、视觉-语言导航、多任务操作策略学习等研究领域,尤其适合需要结合视觉观察与语言指令进行决策的机器人任务。