COIG-CQIA 是一个高质量的中文指令微调数据集,由 m-a-p 团队发布。它旨在为大型语言模型(LLM)提供丰富、多样且经过人工审核的中文指令-响应对,以提升模型在中文任务上的理解和生成能力。
该数据集主要用于:
* 中文大语言模型的指令微调:训练或优化模型遵循中文指令并生成恰当回复。
* 模型对齐研究:帮助模型更好地理解人类意图,生成更有用、更安全、更符合伦理的回复。
* 评估基准:可作为评估模型中文指令遵循能力的测试集。
适用于所有需要训练或评估模型中文对话、问答、内容生成等能力的场景,是构建和优化中文对话AI的重要资源之一。