InternLM2 Technical Report：面向通用能力与推理增强的开源大模型

OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请登录
# InternLM2 技术报告

## 作者
Zheng Cai， Maosong Cao， Haojiong Chen， Kai Chen， Keyu Chen， Xin Chen， Xun Chen， Zehui Chen， Zhi Chen， Pei Chu， Xiaoyi Dong， Haodong Duan， Qi Fan， Zhaoye Fei， Yang Gao， Jiaye Ge， Chenya Gu， Yuzhe Gu， Tao Gui， Aijia Guo， Qipeng Guo， Conghui He， Yingfan Hu， Ting Huang， Tao Jiang， Penglong Jiao， Zhenjiang Jin， Zhikai Lei， Jiaxing Li， Jingwen Li， Linyang Li， Shuaibin Li， Wei Li， Yining Li， Hongwei Liu， Jiangning Liu， Jiawei Hong， Kaiwen Liu， Kuikun Liu， Xiaoran Liu， Chengqi Lv， Haijun Lv， Kai Lv， Li Ma， Runyuan Ma， Zerun Ma， Wenchang Ning， Linke Ouyang， Jiantao Qiu， Yuan Qu， Fukai Shang， Yunfan Shao， Demin Song， Zifan Song， Zhihao Sui， Peng Sun， Yu Sun， Huanze Tang， Bin Wang， Guoteng Wang， Jiaqi Wang， Jiayu Wang， Rui Wang， Yudong Wang， Ziyi Wang， Xingjian Wei， Qizhen Weng， Fan Wu， Yingtong Xiong， Chao Xu， Ruiliang Xu， Hang Yan， Yirong Yan， Xiaogui Yang， Haochen Ye， Huaiyuan Ying， Jia Yu， Jing Yu， Yuhang Zang， Chuyu Zhang， Li Zhang， Pan Zhang， Peng Zhang， Ruijie Zhang， Shuo Zhang， Songyang Zhang， Wenjian Zhang， Wenwei Zhang， Xingcheng Zhang， Xinyue Zhang， Hui Zhao， Qian Zhao， Xiaomeng Zhao， Fengzhe Zhou， Zaida Zhou， Jingming Zhuo， Yicheng Zou， Xipeng Qiu， Yu Qiao， Dahua Lin

## 摘要
ChatGPT 和 GPT-4 等大型语言模型（LLM）的演进引发了关于通用人工智能（AGI）到来的讨论。然而，在开源模型中复现此类进展一直颇具挑战。本文介绍了 InternLM2，这是一个开源 LLM。通过创新的预训练和优化技术，InternLM2 在涵盖 6 个维度、30 个基准的综合评估、长上下文建模以及开放式主观评测中均超越了其前代模型。

报告详细阐述了 InternLM2 的预训练过程，重点介绍了文本、代码和长上下文数据等多种数据类型的准备。InternLM2 能够高效捕获长程依赖，其初始训练 Token 长度为 4k，随后在预训练和微调阶段扩展至 32k，并在 200k 的“大海捞针”测试中表现出色。此外，InternLM2 通过监督微调（SFT）和一种新颖的**条件式在线人类反馈强化学习（COOL RLHF）** 策略进行对齐，该策略旨在解决人类偏好冲突和奖励欺骗问题。通过发布不同训练阶段和模型尺寸的 InternLM2，我们为社区提供了模型进化过程的洞见。

## 主题/分类
- 主要主题：**计算与语言（cs.CL）**
- 次要主题：**人工智能（cs.AI）**
论文地址：https://arxiv.org/abs/2403.17297
46 次点击 ∙ 0 人收藏
登录后收藏
0 条回复