internlm/Agent-FLAN

首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

Agent-FLAN 数据集简介

Agent-FLAN 是一个由上海人工智能实验室（InternLM）发布的指令微调数据集，专门用于提升大语言模型在复杂任务规划和工具使用方面的能力。

主要用途

训练智能体（Agent）：帮助模型学习如何将复杂的用户请求分解为可执行的步骤。
指令遵循（Instruction Following）：增强模型理解和遵循多步骤、结构化指令的能力。
工具调用（Tool Use）：训练模型识别在任务中何时以及如何使用外部工具或API。

数据特性

核心内容：数据集中包含大量经过精心设计的“指令-规划-行动”三元组示例。模型通过学习这些示例，掌握将高层目标（如“帮我订机票”）拆解为具体子任务（查询航班、比价、填写信息等）的逻辑。
任务导向：数据围绕实际应用场景构建，例如信息检索、多轮对话、决策制定等，旨在让模型具备解决现实世界问题的规划能力。
格式规范：数据以标准化的指令微调格式组织，便于直接用于模型的监督微调（SFT）训练。

使用场景

大语言模型微调：适用于希望为现有基座模型（如 InternLM 系列或其他开源模型）注入任务规划和工具调用能力的开发者或研究者。
AI 智能体开发：为构建能够自主或半自主完成复杂流程的AI应用（如自动客服、个人助理、工作流自动化工具）提供高质量的训练数据。
学术研究：可用于研究大语言模型的推理、规划能力以及人机协作交互范式。

数据集地址：https://huggingface.co/datasets/internlm/Agent-FLAN

71 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 11 ms

Developed with Cursor