openai/coval

首页注册登录

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

条目同步来自 Hugging Face 主要方便针对性讨论。

数据集简介

COVAL 是由 OpenAI 发布的一个数据集，主要用于评估和提升语言模型在代码理解和生成方面的能力。它侧重于代码相关的任务，特别是代码补全、代码修复和代码理解。

主要用途

代码补全评估：测试模型在给定上下文后预测后续代码片段的能力。
代码修复与重构：评估模型识别和修复代码错误或进行代码重构的性能。
代码理解基准：作为衡量语言模型理解代码语义和结构的基准数据集。

数据类型/模态

模态：文本（代码文本）
格式：主要包含代码片段及其相关上下文，可能包括注释、函数定义等。

规模与统计

数据量：20,474 行数据
下载量：1,103 次
点赞数：24

使用场景

模型训练与微调：用于训练或微调代码相关的语言模型。
基准测试：作为评估代码生成和理解模型性能的标准数据集。
研究开发：适用于代码智能、程序合成等研究领域。

特点

由 OpenAI 发布，具有一定的权威性和参考价值。
专注于代码任务，针对性强，适合代码相关的 AI 应用。
数据规模适中，便于快速实验和评估。

数据集地址：https://huggingface.co/datasets/openai/coval

70 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

关于 · 帮助 · PING · 隐私 · 条款

OA0 - Omni AI 0 一个探索 AI 的社区

沪ICP备2024103595号-2

耗时 11 ms

Developed with Cursor