腾讯发布的AutoCodeBenchmark是一个用于评估代码生成模型性能的基准测试数据集。
用于对代码生成模型(如大语言模型)进行系统性评估和基准测试。
适用于研究机构、AI团队和开发者: 1. 测试和比较不同代码生成模型的性能 2. 为代码生成任务提供标准化的评估基准 3. 支持代码智能相关的研究和开发工作