首页
注册
登录
OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请
登录
说明
条目同步来自
Hugging Face
主要方便针对性讨论。
OA0
›
数据集
›
Microsoft
microsoft/NextCoderDataset
Microsoft
·
2025-07-08 15:02:15
· 21 次点击 ·
0
条评论
数据集简介
由微软发布的代码生成与补全数据集,旨在支持代码大模型的训练与评估。
主要用途
训练和微调代码生成模型(如代码补全、代码生成等任务)
评估模型在代码理解和生成方面的能力
数据类型/模态
模态类型
:纯文本
数据格式
:包含代码片段及相关上下文信息
规模与统计
数据量
:约 38.1 万条样本
下载量
:932 次
点赞数
:53
使用场景
适用于:
- 代码智能辅助工具开发
- 编程教育中的自动代码生成
- 研究代码大模型的数据集构建与基准测试
数据集地址:
https://huggingface.co/datasets/microsoft/NextCoderDataset
21 次点击 ∙ 0 人收藏
登录后收藏
0 条回复
关于
·
帮助
·
PING
·
隐私政策
·
服务条款
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 16 ms
Developed with
Cursor