作者: Anas Awadalla, Irena Gao, Josh Gardner, Jack Hessel, Yusuf Hanafy, Wanrong Zhu, Kalyani Marathe, Yonatan Bitton, Samir Gadre, Shiori Sagawa, Jenia Jitsev, Simon Kornblith, Pang Wei Koh, Gabriel Ilharco, Mitchell Wortsman, Ludwig Schmidt
提交/修订日期: 2023年8月2日提交,2023年8月7日修订
摘要:
本文介绍了 OpenFlamingo,一个参数规模从 30 亿到 90 亿不等的自回归视觉语言模型系列。OpenFlamingo 是一个旨在复现 DeepMind 的 Flamingo 模型的开源项目。在七个视觉语言数据集上,OpenFlamingo 模型的平均性能达到了对应 Flamingo 模型性能的 80% 到 89%。本技术报告描述了我们的模型、训练数据、超参数和评估套件。我们在 https://github.com/mlfoundations/open_flamingo 分享了模型和代码。
主题/分类:
- 计算机视觉与模式识别 (cs.CV)
- 人工智能 (cs.AI)
- 机器学习 (cs.LG)