数据集简介
Salesforce 发布的 xLAM 函数调用数据集,包含 6 万条文本样本,旨在支持大语言模型(LLM)进行函数调用任务的学习与评估。
主要用途
- 训练或微调语言模型,使其能够根据用户指令或对话上下文,正确识别并调用相应的函数。
- 评估模型在函数调用任务上的准确性和泛化能力。
- 可用于构建需要执行具体操作(如 API 调用、工具使用)的对话系统或智能助手。
数据类型/模态
- 模态:纯文本(text)
- 格式:JSON
- 规模:60,000 行数据
数据特性
- 数据以结构化 JSON 格式存储,便于程序化读取和处理。
- 专注于“函数调用”这一特定任务,样本可能包含指令、函数描述及预期的调用参数等内容。
- 由 Salesforce 团队创建和维护,在社区内获得较高关注(点赞数 573,下载量 4777)。
使用场景
- 模型训练:作为监督学习数据,训练模型理解何时以及如何调用函数。
- 基准测试:为函数调用能力提供一个标准的评估数据集。
- 工具学习:开发能够使用外部工具或 API 的智能体(Agent)。