OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
OA0  ›  代码  ›  Moondream — 轻量级视觉语言模型,适合边缘侧多模态理解

Moondream — 轻量级视觉语言模型,适合边缘侧多模态理解

 
  august ·  2026-02-19 21:02:10 · 9 次点击  · 0 条评论  

🌔 moondream

一个轻量级视觉语言模型,性能出色且随处可运行

官网 | 演示

示例

图片 示例
女孩在做什么?
女孩正坐在桌边吃一个大汉堡。

女孩的头发是什么颜色?
女孩的头发是白色的。
这是什么?
这是一个计算机服务器机架,用于存储和管理多台计算机服务器的设备。机架内装有多台计算机服务器,每台服务器都有自己专用的空间和电源。服务器通过多根电缆连接到机架,表明它们是更大系统的一部分。机架放置在地毯上,附近有一张沙发,暗示这个设置位于生活或娱乐区域。

架子后面是什么?
架子后面是一面砖墙。

关于

Moondream 是一个高效的开源视觉语言模型,它结合了强大的图像理解能力和极小的模型体积。该模型设计灵活且易于使用,能够在广泛的设备和平台上运行。

项目提供两种模型变体:

  • Moondream 2B:主要模型,拥有 20 亿参数,为图像描述、视觉问答和物体检测等通用图像理解任务提供稳健性能。
  • Moondream 0.5B:紧凑的 5 亿参数模型,专门针对边缘设备作为蒸馏目标进行优化,可在资源受限的硬件上高效部署,同时保持出色的能力。

如何使用

Moondream 可以在本地或云端运行。详情请参阅快速入门页面。

特别感谢

9 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私 ·  条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 13 ms
Developed with Cursor