OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
说明
  • 条目同步来自 Hugging Face 主要方便针对性讨论。
OA0  ›  数据集  ›  Qwen

Qwen/ProcessBench

 
  Qwen  ·  2024-12-27 14:05:30  ·  24 次点击  ·  0 条评论  

数据集简介

ProcessBench 是由 Qwen 团队发布的一个文本数据集,专注于流程推理与执行任务。它旨在评估和提升语言模型在理解、规划和执行多步骤任务方面的能力。

主要用途

该数据集主要用于测试和训练语言模型处理复杂流程的能力,例如:
- 解析自然语言描述的步骤
- 生成或执行有序的操作序列
- 解决需要多步推理的问题

数据类型与模态

  • 模态:纯文本(text)
  • 格式:JSON
  • 规模:包含 3,400 条数据样本

使用场景

适用于以下研究方向或应用:
- 流程自动化与任务规划
- 指令跟随与步骤推理
- 评估模型在序列决策和逻辑执行上的性能

24 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 32 ms
Developed with Cursor