数据集简介
该数据集由 AllenAI 发布,是一个用于指令微调(SFT)和工具使用的文本数据集,旨在训练或优化模型在遵循指令和调用工具方面的能力。
主要用途
- 指令微调:用于对语言模型进行监督式微调,使其更好地理解和遵循人类指令。
- 工具使用:训练模型学习如何与外部工具(如 API、函数、计算器等)进行交互以完成任务。
数据类型与模态
- 模态:纯文本。
- 内容:包含指令、任务描述以及可能涉及工具使用的对话或交互数据。
规模与统计
- 数据量:包含约 22.8 万行数据。
- 格式:提供 Parquet 及优化版 Parquet 格式,便于高效处理。
使用场景
适用于开发或微调能够执行复杂指令、并具备工具调用能力的智能助手或专业领域模型。