OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
OA0  ›  论文  ›  abs/2308.12950v2

Code Llama:面向代码补全与生成的大语言模型

 
  model ·  2026-03-14 06:42:42 · 4 次点击  · 0 条评论  

Code Llama: Open Foundation Models for Code

作者: Baptiste Rozière, Jonas Gehring, Fabian Gloeckle, Sten Sootla, Itai Gat, Xiaoqing Ellen Tan, Yossi Adi, Jingyu Liu, Tal Remez, Jérémy Rapin, Artyom Kozhevnikov, Ivan Evtimov, Joanna Bitton, Manish Bhatt, Cristian Canton Ferrer, Aaron Grattafiori, Wenhan Xiong, Alexandre Défossez, Jade Copet, Faisal Azhar, Hugo Touvron, Louis Martin, Nicolas Usunier, Thomas Scialom, Gabriel Synnaeve

提交/修订日期: 2023年8月24日提交,2023年8月25日修订 (v2)

主题/分类: Computation and Language (cs.CL)

摘要:
本文发布了 Code Llama,一个基于 Llama 2 的、用于代码的大型语言模型系列。该系列在开源模型中提供了最先进的性能,具备代码填充能力、支持长输入上下文,并拥有针对编程任务的零样本指令跟随能力。我们提供了多种变体以覆盖广泛的应用场景:基础模型 (Code Llama)、Python 专用模型 (Code Llama - Python) 和指令跟随模型 (Code Llama - Instruct),每种模型都有 7B、13B 和 34B 参数版本。所有模型均在 16k 令牌序列上进行训练,并在处理长达 100k 令牌的输入时表现出性能提升。7B 和 13B 的 Code Llama 及 Code Llama - Instruct 变体支持基于周围内容的代码填充。Code Llama 在多个代码基准测试中达到了开源模型的最先进性能,在 HumanEval 和 MBPP 上的得分分别高达 53% 和 55%。值得注意的是,Code Llama - Python 7B 在 HumanEval 和 MBPP 上超越了 Llama 2 70B,并且我们所有的模型在 MultiPL-E 上都优于其他所有公开可用的模型。我们在一个允许研究和商业使用的宽松许可下发布了 Code Llama。

4 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 12 ms
Developed with Cursor