数据集简介
CodeXGLUE 代码补全(行级)数据集,由 Google 发布,专注于代码自动补全任务,旨在评估和训练模型在行级别预测代码片段的能力。
主要用途
- 代码补全研究:用于训练和评估代码生成模型,特别是针对行级别的代码补全任务。
- 编程辅助工具开发:可作为构建智能代码编辑器、IDE插件等编程辅助工具的训练数据。
数据类型/模态
- 模态类型:文本(纯代码文本)
- 数据格式:Parquet
规模与统计
- 数据量:13,000 行
- 下载量:185 次
- 点赞数:6
使用场景
- 机器学习研究,特别是代码生成和自然语言处理(NLP)领域。
- 开发基于深度学习的代码补全系统。
- 学术基准测试,用于比较不同模型在代码补全任务上的性能。