OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
OA0  ›  社区  ›  MCP

Chrome 146 更新带来关键变化:AI Agent 可以直接控制真实浏览器

 
  token ·  2026-03-14 18:52:34 · 10 次点击  · 0 条评论  

最近发布的 Chrome 146 浏览器版本(Google Chrome 第146个主版本更新)带来了一项看似不起眼、但可能深刻影响 AI Agent 发展的能力:
浏览器开始原生支持通过 MCP 接口控制当前浏览器会话。

简单来说,这意味着 AI 可以直接操作你正在使用的 Chrome 浏览器,而不需要再启动专门的自动化浏览器或重新登录账户。

对于很多开发 AI Agent、自动化助手或 AI 浏览器工具的人来说,这可能是一个非常重要的变化。


过去:AI 操作浏览器一直很麻烦

在 Chrome 146 之前,如果开发者希望 AI 自动操作网页,一般只能用两种办法。

1. 使用 Headless 浏览器

Headless 浏览器就是 没有界面的浏览器,常见工具包括 Puppeteer、Playwright 等。

AI 可以控制这些浏览器访问网页、点击按钮、填写表单等。

但问题是:

  • 很多网站会检测 Headless 浏览器
  • 一旦被识别为自动化工具就会限制访问
  • 一些网站甚至直接封禁

因此这种方式在很多真实业务场景里并不好用。

2. 复制登录状态

另一种办法是把 用户真实浏览器里的 Cookie、Token 复制到自动化浏览器里。

这样 AI 可以假装已经登录。

但这个方案也很麻烦:

  • 需要手动导出 Cookie
  • Token 经常失效
  • 浏览器环境容易不一致

很多开发者为了解决这些问题,还专门写插件或中继服务来桥接浏览器能力,但稳定性一直不理想。


Chrome 146 的变化:直接控制当前浏览器

Chrome 146 带来的变化是:

AI Agent 可以直接连接你正在使用的 Chrome 浏览器,并操作当前会话。

开发者只需要打开浏览器里的一个调试开关:

chrome://inspect/#remote-debugging

开启之后,AI Agent 就可以通过 Chrome DevTools Protocol(CDP) 或 MCP 接口控制浏览器。

关键区别在于:

  • 不是新开浏览器
  • 不是无界面浏览器
  • 而是直接控制你正在使用的 Chrome

这意味着 AI 可以:

  • 使用你已经登录的网站
  • 打开你已有的标签页
  • 操作真实浏览器环境

实际案例:AI 自动清理 LinkedIn 推销请求

开发者 Petr Baudis 做了一个很直观的演示。

他让 Claude AI 连接自己的 Chrome 浏览器,然后执行一个任务:

清理 LinkedIn 上那些推销产品的连接邀请。

AI 的操作流程是:

  1. 打开 LinkedIn 页面
  2. 查看所有连接请求
  3. 分析邀请内容
  4. 判断哪些是推销消息
  5. 自动忽略这些邀请

整个过程使用的是 他已经登录的 LinkedIn 会话,不需要任何额外认证。


这意味着什么?

Chrome 146 的这个能力,实际上解决了 AI 浏览器自动化的几个核心问题。

不需要重新登录

AI 可以直接使用你当前浏览器里的登录状态。

比如:

  • Gmail
  • LinkedIn
  • GitHub
  • 企业后台系统

都可以直接操作。


不会触发自动化检测

因为 AI 操作的是 真实浏览器,不是自动化工具。

很多网站原本会检测:

  • Headless 浏览器
  • 自动化脚本
  • 机器指纹

现在这些检测更难触发。


自动化能力明显增强

很多以前难做的任务现在变得更容易,例如:

  • 自动填写网页表单
  • 操作政府网站流程
  • 自动处理客服后台
  • 测试自己开发的 Web 应用
  • 管理企业系统

这些场景过去经常被登录、验证或反自动化机制卡住。


但也带来了新的安全问题

让 AI 操作真实浏览器,其实也有风险。

例如:

  • AI 可能误操作账户
  • 自动提交错误信息
  • 点击不该点击的按钮

因此很多人认为未来必须有:

  • 权限控制
  • 操作日志
  • 用户确认机制

否则 Agent 权限过大会带来安全隐患。


开源工具已经开始支持

目前有开发者已经为这一能力做了优化工具,例如:

chrome-cdp-skill

https://github.com/pasky/chrome-cdp-skill

安装方法:

npx skills add https://github.com/pasky/chrome-cdp-skill

一些 AI Agent 框架也在跟进支持,例如 OpenClaw。

如果浏览器操作能力变得更高效,未来 AI 执行网页任务的 token 消耗也可能明显下降。


AI Agent 的关键能力之一

对大语言模型来说,使用浏览器一直是最重要的能力之一

很多真实任务都离不开网页操作,例如:

  • 搜索信息
  • 提交申请
  • 管理账户
  • 使用在线工具

Chrome 146 的这个更新,让 AI 第一次可以比较自然地接管真实浏览器环境

对于 AI Agent、自动化助手以及 AI 浏览器产品来说,这可能是一个非常重要的基础设施变化。

10 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  Ping ·   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor