数据集简介
这是一个由 ByteDance-Seed 发布的编程竞赛数据集,旨在为代码生成、程序理解和算法问题求解等任务提供高质量的基准数据。
主要用途
- 训练和评估代码生成模型(如大语言模型在编程任务上的表现)。
- 研究算法问题求解与自动编程。
- 可作为教育或竞赛平台的数据资源。
数据类型/模态
- 模态:表格数据(Tabular)与文本(Text)混合。
- 数据内容主要包含编程竞赛题目、相关的代码解决方案及元信息。
规模与统计
- 数据总行数:49,248 条。
- 下载量:6,855 次。
- 点赞数:57。
使用场景
适用于人工智能、计算机科学教育、代码大模型研发等领域的研究人员和开发者。