一个轻量级视觉语言模型,性能出色且随处可运行
| 图片 | 示例 |
|---|---|
![]() |
女孩在做什么? 女孩正坐在桌边吃一个大汉堡。 女孩的头发是什么颜色? 女孩的头发是白色的。 |
![]() |
这是什么? 这是一个计算机服务器机架,用于存储和管理多台计算机服务器的设备。机架内装有多台计算机服务器,每台服务器都有自己专用的空间和电源。服务器通过多根电缆连接到机架,表明它们是更大系统的一部分。机架放置在地毯上,附近有一张沙发,暗示这个设置位于生活或娱乐区域。 架子后面是什么? 架子后面是一面砖墙。 |
Moondream 是一个高效的开源视觉语言模型,它结合了强大的图像理解能力和极小的模型体积。该模型设计灵活且易于使用,能够在广泛的设备和平台上运行。
项目提供两种模型变体:
Moondream 可以在本地或云端运行。详情请参阅快速入门页面。