OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  stagehand-browser-cli: 高级网页交互自动化命令行工具

stagehand-browser-cli: 高级网页交互自动化命令行工具

 
  infrastructure ·  2026-02-02 18:07:23 · 3 次点击  · 0 条评论  

名称: browser
描述: 通过 CLI 命令使用自然语言自动化网页浏览器交互。当用户要求浏览网站、导航网页、从网站提取数据、截图、填写表单、点击按钮或与 Web 应用交互时使用。
允许工具: Bash


浏览器自动化

使用 Stagehand CLI 与 Claude 自动化浏览器交互。

第一步:环境选择(本地 vs 远程)

本技能会根据配置自动选择本地或远程浏览器环境:
- 如果存在 Browserbase API 密钥(.env 文件中包含 BROWSERBASE_API_KEY 和 BROWSERBASE_PROJECT_ID):使用远程 Browserbase 环境
- 如果没有 Browserbase API 密钥:回退到本地 Chrome 浏览器
- 无需用户干预:选择过程基于可用配置自动完成

首次设置(仅需一次)

检查本目录下的 setup.json 文件。如果 setupComplete: false,请执行:

npm install    # 安装依赖
npm link       # 创建全局 'browser' 命令

命令列表

所有命令在两种模式下功能一致:

browser navigate <url>                    # 访问指定 URL
browser act "<action>"                    # 执行自然语言描述的操作
browser extract "<instruction>" ['{}']    # 提取数据(可提供 JSON 结构)
browser observe "<query>"                 # 查找页面元素
browser screenshot                        # 截图
browser close                             # 关闭浏览器

快速示例

browser navigate https://example.com
browser act "点击登录按钮"
browser extract "获取页面标题"
browser close

模式对比

特性 本地模式 Browserbase 模式
速度 更快 稍慢
设置要求 需安装 Chrome 需配置 API 密钥
隐身模式 不支持 支持
代理/CAPTCHA 支持 不支持 支持
适用场景 开发测试 生产环境/数据采集

最佳实践

  1. 先导航再操作:执行交互前务必先访问目标页面
  2. 查看截图确认:每步操作后可通过截图验证结果
  3. 描述具体明确:动作描述要清晰准确
  4. 完成后关闭浏览器:及时释放资源

故障排除

  • 找不到 Chrome:请安装 Chrome 或切换到 Browserbase 模式
  • 操作失败:使用 browser observe 命令查看可用页面元素
  • Browserbase 异常:检查 API 密钥和项目 ID 配置是否正确

详细示例请参阅 EXAMPLES.md
API 参考文档请查看 REFERENCE.md

3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor