数据集简介
由 NVIDIA 发布的指令遵循与结构化输出数据集,主要用于强化学习(RL)训练,旨在提升模型遵循复杂指令并生成结构化输出的能力。
主要用途
- 强化学习训练:为模型提供高质量的指令-响应对,用于 RLHF(人类反馈强化学习)或直接偏好优化等训练流程。
- 结构化输出生成:训练模型生成符合特定格式、结构或约束的文本输出。
数据类型与模态
- 模态:纯文本
- 格式:JSON
- 内容:包含指令(prompt)与相应结构化输出的配对数据。
规模与统计
- 数据量:9,949 条样本
- 下载量:196
- 点赞数:33
使用场景
- 训练或微调大语言模型(LLM),使其更好地理解和执行包含格式要求的复杂指令。
- 作为评估基准,测试模型在生成JSON、代码、表格等结构化内容时的性能。
- 适用于需要精确控制输出格式的应用开发,如自动化报告生成、数据转换、API响应生成等。