OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
说明
  • 条目同步来自 Hugging Face 主要方便针对性讨论。
OA0  ›  数据集  ›  Google

google/code_x_glue_cc_clone_detection_poj104

 
  Google  ·  2024-01-24 13:57:30  ·  22 次点击  ·  0 条评论  

数据集简介

该数据集是 Google 发布的 CodeXGLUE 基准测试的一部分,专注于代码克隆检测任务。具体来说,它基于 POJ-104 数据集构建,旨在评估模型识别功能相似但实现方式不同的代码片段(即代码克隆)的能力。

主要用途

用于训练和评估代码克隆检测模型,是代码理解和软件工程领域的重要基准。

数据类型/模态

  • 模态:文本
  • 内容:编程代码片段(具体语言未在元数据中明确,但 POJ-104 通常包含 C/C++ 代码)。

规模与统计信息

  • 数据量:53,000 行数据
  • 格式:Parquet
  • 下载量:188 次
  • 点赞数:8

使用场景

  1. 代码克隆检测研究:开发能够自动识别重复或相似代码的算法。
  2. 模型基准测试:作为评估代码表示学习、代码相似性分析等模型性能的标准数据集。
  3. 软件质量维护:辅助发现代码库中的冗余代码,有助于重构和维护。
22 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 13 ms
Developed with Cursor