OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
OA0  ›  论文  ›  abs/2211.05100

BLOOM:一个 176B 参数的开源多语种语言模型

 
  breezeo ·  2026-01-18 07:12:42 · 10 次点击  · 0 条评论  

BLOOM: 一个 1760 亿参数的开源多语言大语言模型

作者: BigScience Workshop (由 Teven Le Scao 等数百名研究人员合作完成)

提交日期: 2022年11月9日 (最后修订于 2023年6月27日)

主题/分类: 计算与语言 (cs.CL)

摘要

大型语言模型 (LLMs) 已被证明能够基于少量示例演示或自然语言指令来执行新任务。尽管这些能力导致了其被广泛采用,但大多数 LLMs 由资源丰富的组织开发,并且通常不向公众开放。作为迈向民主化这一强大技术的一步,我们提出了 BLOOM,一个由数百名研究人员合作设计和构建的 1760 亿参数开源语言模型。

BLOOM 是一个仅解码器的 Transformer 语言模型,在 ROOTS 语料库上训练而成。该数据集包含来自 46 种自然语言和 13 种编程语言(总计 59 种)的数百个来源。我们发现 BLOOM 在多种基准测试中取得了有竞争力的性能,在经过多任务提示微调后结果更强。为了促进未来基于 LLMs 的研究和应用,我们在负责任 AI 许可证下公开发布了我们的模型和代码。

10 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 20 ms
Developed with Cursor