CodeFeedback-Filtered-Instruction 数据集简介
概述
这是一个专注于代码反馈与指令的数据集,主要用于训练或评估AI模型在代码生成、代码修复和代码理解方面的能力。数据集经过筛选处理,旨在提供高质量的指令-反馈对。
主要用途
- 训练代码生成与修复模型
- 评估AI模型的代码理解与反馈能力
- 用于指令调优(instruction tuning)任务
数据类型
- 模态:纯文本
- 格式:JSON
- 内容:包含指令与相应反馈的文本数据对
数据规模
- 总数据量:156,526 条记录
- 下载量:5,686+
- 社区认可度:182 次点赞
使用场景
- 代码辅助工具开发
- 编程教育应用
- AI代码审查系统
- 大语言模型的代码领域微调
特点
- 数据经过过滤处理,质量较高
- 专注于代码相关的指令反馈场景
- 开源可用,无需特殊访问权限