数据集简介
OctoCodingBench 是一个由 MiniMaxAI 发布的编程代码评估基准数据集,旨在用于测试和评估代码生成模型的性能。
主要用途
- 作为代码生成模型的评估基准
- 用于模型性能测试和比较
数据类型/模态
- 模态类型:纯文本
- 数据格式:JSON
- 内容类型:编程代码相关数据
规模信息
- 数据行数:72 行
- 下载量:约 1.8 万次
- 点赞数:262
使用场景
- 代码生成模型评估
- AI编程助手性能测试
- 研究机构进行模型基准测试
特点说明
- 数据集规模较小但下载量较高,表明在代码评估领域有较好的关注度
- 采用开放的 JSON 格式,便于使用常见数据处理工具(如 pandas、polars)进行分析
- 非门控数据集,可公开访问使用