CodeT5 与 CodeT5+

Salesforce Research 官方发布的用于代码理解与生成的 CodeT5 和 CodeT5+ 模型。相关论文如下：

论文标题: CodeT5+: 面向代码理解与生成的开源代码大语言模型

作者: Yue Wang*, Hung Le*, Akhilesh Deepak Gotmare, Nghi D.Q. Bui, Junnan Li, Steven C.H. Hoi (* 表示同等贡献)

论文标题: CodeT5: 面向代码理解与生成的标识符感知统一预训练编码器-解码器模型

作者: Yue Wang, Weishi Wang, Shafiq Joty, Steven C.H. Hoi

在实践中，CodeT5 和 CodeT5+ 模型可以作为 AI 驱动的编码助手部署，以提高软件开发人员的生产力。在 Salesforce，我们使用 CodeT5 构建了一个 AI 编码助手演示，作为 VS Code 插件提供以下三种功能：

文本到代码生成：根据自然语言描述生成代码。
代码自动补全：给定目标函数名，补全整个函数代码。
代码摘要：生成函数代码的自然语言描述摘要。

CodeT5 演示

引用

如果您发现此代码对您的研究有用，请考虑引用：

@inproceedings{
    wang2021codet5,
    title={CodeT5: Identifier-aware Unified Pre-trained Encoder-Decoder Models for Code Understanding and Generation},
    author={Yue Wang, Weishi Wang, Shafiq Joty, Steven C.H. Hoi},
    booktitle={EMNLP},
    year={2021},
}

@inproceedings{
    le2022coderl,
    title={CodeRL: Mastering Code Generation through Pretrained Models and Deep Reinforcement Learning},
    author={Le, Hung and Wang, Yue and Gotmare, Akhilesh Deepak and Savarese, Silvio and Hoi, Steven C. H.},
    booktitle={NeurIPS},
    year={2022}
}

@article{
    wang2023codet5plus,
    title={CodeT5+: Open Code Large Language Models for Code Understanding and Generation},
    author={Wang, Yue and Le, Hung and Gotmare, Akhilesh Deepak and Bui, Nghi D.Q. and Li, Junnan and Hoi, Steven C. H.},
    journal={arXiv preprint},
    year={2023}
}

许可证

代码根据 BSD-3 许可证发布（详见 LICENSE.txt），但我们同时要求用户遵守以下原则：

本软件不得用于促进或从以下行为中获利：

暴力、仇恨与分裂，
环境破坏，
侵犯人权，
或损害人们的身心健康。

我们鼓励本软件的用户通过发送邮件至 codeT5@salesforce.com 告知我们其应用场景，并在开发此模型的高风险应用时，使用适当的文档。

参与贡献

如果您有任何问题、建议、请求或错误报告，请在 GitHub 上创建 issue。我们欢迎 Pull Requests！

项目地址：https://github.com/salesforce/CodeT5

25 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

CodeT5 — 代码理解生成模型

CodeT5 与 CodeT5+

最新动态：🎉

引用

许可证

参与贡献