OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
OA0  ›  论文  ›  abs/2403.08295

DBRX:面向通用能力与效率优化的开放式混合专家语言模型

 
  abstract ·  2026-06-12 11:01:14 · 18 次点击  · 0 条评论  

Gemma: Open Models Based on Gemini Research and Technology

标题

Gemma: Open Models Based on Gemini Research and Technology

作者

Gemma Team(Thomas Mesnard, Cassidy Hardin, Robert Dadashi 等 100 余位作者,含 Jeff Dean, Demis Hassabis 等)

摘要

本文介绍了 Gemma——一个基于 Gemini 模型的研究和技术构建的轻量级、最先进的开源模型家族。Gemma 模型在语言理解、推理和安全性等学术基准测试中展现出强劲性能。团队发布了两种模型尺寸(20 亿参数70 亿参数),并提供预训练和微调后的检查点。在 18 项基于文本的任务中,Gemma 在 11 项上超越了同等规模的开源模型。论文还呈现了对模型安全性和责任性的全面评估,以及详细的模型开发描述。作者认为,负责任地发布 LLM 对于提升前沿模型的安全性以及推动下一波 LLM 创新至关重要。

主题/分类

  • 主要学科:计算与语言 (cs.CL)
  • 相关学科:人工智能 (cs.AI)

其他信息

  • 提交日期:2024 年 3 月 13 日(v1),最后修订于 2024 年 4 月 16 日(v4)
  • arXiv ID:2403.08295
  • 许可证:Creative Commons Attribution 4.0 International (CC BY 4.0)
18 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私 ·  条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 16 ms
Developed with Cursor