这是一个用于大型语言模型(LLM)后训练(Post-Training)的文本数据集,由东京工业大学LLM团队发布。
专门用于对已预训练的大型语言模型进行进一步的后训练,旨在提升模型的指令遵循、对话能力或其他特定下游任务的性能。
适用于研究人员和开发者对如 Nemotron 等系列的大型语言模型进行监督微调(SFT)或后训练,以优化模型在特定领域或任务上的表现。