数据集简介
Google 发布的 CodeXGLUE 代码精炼数据集,专注于代码修复与改进任务。
主要用途
用于训练和评估代码自动修复、代码质量提升等模型,帮助开发者优化存在缺陷或低效的代码片段。
数据类型/模态
- 模态类型:文本
- 数据格式:代码文本对(包含原始代码与精炼后的目标代码)
规模与统计
- 数据量:约 12.4 万条样本
- 下载量:563 次
- 点赞数:7
使用场景
- 代码缺陷修复:自动检测并修正代码中的错误。
- 代码优化:将代码重构为更高效、更规范的版本。
- 模型训练与评估:作为代码生成、代码翻译等任务的基准数据集。