Mind2Web 数据集简介
概述
Mind2Web 是一个用于训练和评估智能体在真实网页环境中执行复杂任务的数据集。它旨在推动通用网络智能体的发展,使其能够理解自然语言指令并在多样化的网站上进行多步骤交互。
主要用途
- 训练和评估网络导航智能体。
- 研究智能体在开放领域网页上的任务规划和执行能力。
- 作为通用网络智能体(如 WebGUM)的基准测试数据集。
数据类型与模态
- 模态类型:文本(Text)
- 数据格式:JSON
- 核心内容:包含真实网页上的任务指令、对应的操作轨迹(如点击、输入等动作序列)以及网页的DOM结构信息。
规模与特点
- 样本数量:253 个任务实例(来自元数据中的行数)。
- 关键特性:
- 真实环境:任务基于实际的、多样化的网站(如购物、旅行、政务服务等)。
- 复杂任务:包含需要多步骤推理和操作的长视野任务。
- 全面标注:提供了详细的动作序列和网页状态,支持端到端的学习与评估。
- 泛化性强:旨在测试智能体在未见过的网站和任务上的执行能力。
适用场景
- 人工智能与机器学习研究,特别是强化学习、模仿学习在网页交互领域的应用。
- 开发能够自动化完成网页操作(如信息查询、预订、填写表单)的智能助手。
- 作为评估模型网页理解与交互能力的基准平台。