标题: GPT-4 Technical Report
作者: OpenAI, Josh Achiam, Steven Adler 等(共 280 位作者)
摘要:
我们报告了 GPT-4 的开发,这是一个大规模、多模态模型,能够接受图像和文本输入并生成文本输出。尽管在许多现实场景中能力仍不及人类,但 GPT-4 在各种专业和学术基准测试中表现出人类水平的性能,例如在模拟律师资格考试中取得了约前 10% 考生的成绩。GPT-4 是一个基于 Transformer 的模型,通过预测文档中的下一个 token 进行预训练。训练后的对齐过程使其在事实性和遵循期望行为方面的性能得到提升。本项目的一个核心组成部分是开发了在广泛规模范围内行为可预测的基础设施和优化方法。这使我们能够基于计算量不超过 GPT-4 千分之一的模型,准确预测 GPT-4 的某些性能方面。
主题/分类:
- 主要类别: 计算与语言 (cs.CL)
- 次要类别: 人工智能 (cs.AI)
提交信息:
- 首次提交: 2023年3月15日
- 当前版本 (v6): 2024年3月4日
- 论文长度: 100页
- arXiv ID: 2303.08774