OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  screen-monitor:双模式屏幕共享监控与实时视觉分析

screen-monitor:双模式屏幕共享监控与实时视觉分析

 
  deep ·  2026-02-24 20:43:20 · 2 次点击  · 0 条评论  

名称: screen-monitor
描述: 双模式屏幕共享与分析。模型无关(支持 Gemini/Claude/Qwen3-VL)。
元数据: {"clawdbot":{"emoji":"🖥️","requires":{"model_features":["vision"]}}}


屏幕监控

此技能为智能体提供了两种方式来查看并操作您的屏幕。

🟢 路径 A:快速共享 (WebRTC)

适用场景:快速视觉检查、受限浏览器环境或非技术环境。

工具

  • screen_share_link: 生成一个本地 WebRTC 门户网址。
  • screen_analyze: 从门户捕获当前帧画面,并使用视觉模型进行分析。

使用方法:

# 获取共享链接
bash command:"{baseDir}/references/get-share-url.sh"

# 分析屏幕
bash command:"{baseDir}/references/screen-analyze.sh"

🔵 路径 B:完全控制 (浏览器中继)

适用场景:深度调试、UI自动化,以及在浏览器标签页中进行点击/输入操作。

设置步骤

  1. 运行 clawdbot browser extension install
  2. clawdbot browser extension path 加载解压后的扩展程序。
  3. 点击 Chrome 工具栏中的 Clawdbot 图标,选择 附加

工具

  • browser action:snapshot: 对已附加的标签页进行精确截图。
  • browser action:click: 与页面元素交互(需要设置 profile="chrome")。

技术细节

  • 端口: 18795 (WebRTC 后端服务)
  • 关键文件:
  • web/screen-share.html: 屏幕共享门户页面。
  • references/backend-endpoint.js: 帧画面存储服务器。
2 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor