OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
说明
  • 条目同步来自 Hugging Face 主要方便针对性讨论。
OA0  ›  数据集  ›  Intern Large Models

internlm/Agent-FLAN

 
  Intern Large Models  ·  2024-03-20 09:45:55  ·  18 次点击  ·  0 条评论  

Agent-FLAN 数据集简介

Agent-FLAN 是一个由上海人工智能实验室(InternLM)发布的指令微调数据集,专门用于提升大语言模型在复杂任务规划和工具使用方面的能力。

主要用途

  • 训练智能体(Agent):帮助模型学习如何将复杂的用户请求分解为可执行的步骤。
  • 指令遵循(Instruction Following):增强模型理解和遵循多步骤、结构化指令的能力。
  • 工具调用(Tool Use):训练模型识别在任务中何时以及如何使用外部工具或API。

数据特性

  • 核心内容:数据集中包含大量经过精心设计的“指令-规划-行动”三元组示例。模型通过学习这些示例,掌握将高层目标(如“帮我订机票”)拆解为具体子任务(查询航班、比价、填写信息等)的逻辑。
  • 任务导向:数据围绕实际应用场景构建,例如信息检索、多轮对话、决策制定等,旨在让模型具备解决现实世界问题的规划能力。
  • 格式规范:数据以标准化的指令微调格式组织,便于直接用于模型的监督微调(SFT)训练。

使用场景

  • 大语言模型微调:适用于希望为现有基座模型(如 InternLM 系列或其他开源模型)注入任务规划和工具调用能力的开发者或研究者。
  • AI 智能体开发:为构建能够自主或半自主完成复杂流程的AI应用(如自动客服、个人助理、工作流自动化工具)提供高质量的训练数据。
  • 学术研究:可用于研究大语言模型的推理、规划能力以及人机协作交互范式。
18 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 12 ms
Developed with Cursor