Code Llama: Open Foundation Models for Code

作者： Baptiste Rozière, Jonas Gehring, Fabian Gloeckle, Sten Sootla, Itai Gat, Xiaoqing Ellen Tan, Yossi Adi, Jingyu Liu, Tal Remez, Jérémy Rapin, Artyom Kozhevnikov, Ivan Evtimov, Joanna Bitton, Manish Bhatt, Cristian Canton Ferrer, Aaron Grattafiori, Wenhan Xiong, Alexandre Défossez, Jade Copet, Faisal Azhar, Hugo Touvron, Louis Martin, Nicolas Usunier, Thomas Scialom, Gabriel Synnaeve

提交/修订日期： 2023年8月24日提交，2023年8月25日修订 (v2)

主题/分类： Computation and Language (cs.CL)

摘要：
本文发布了 Code Llama，一个基于 Llama 2 的、用于代码的大型语言模型系列。该系列在开源模型中提供了最先进的性能，具备代码填充能力、支持长输入上下文，并拥有针对编程任务的零样本指令跟随能力。我们提供了多种变体以覆盖广泛的应用场景：基础模型 (Code Llama)、Python 专用模型 (Code Llama - Python) 和指令跟随模型 (Code Llama - Instruct)，每种模型都有 7B、13B 和 34B 参数版本。所有模型均在 16k 令牌序列上进行训练，并在处理长达 100k 令牌的输入时表现出性能提升。7B 和 13B 的 Code Llama 及 Code Llama - Instruct 变体支持基于周围内容的代码填充。Code Llama 在多个代码基准测试中达到了开源模型的最先进性能，在 HumanEval 和 MBPP 上的得分分别高达 53% 和 55%。值得注意的是，Code Llama - Python 7B 在 HumanEval 和 MBPP 上超越了 Llama 2 70B，并且我们所有的模型在 MultiPL-E 上都优于其他所有公开可用的模型。我们在一个允许研究和商业使用的宽松许可下发布了 Code Llama。

论文地址：https://arxiv.org/abs/2308.12950v2

42 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

Code Llama：面向代码补全与生成的大语言模型

Code Llama: Open Foundation Models for Code