OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
OA0  ›  社区  ›  Claude

AI 开始“握住鼠标”:从建议到执行的质变

 
  close ·  2026-03-24 18:52:11 · 5 次点击  · 0 条评论  

在最新的研究预览中,Claude 已经不再只是停留在对话层,而是可以直接介入桌面环境:

  • 移动指针、点击图标
  • 在不同应用之间切换
  • 操作浏览器、填写表单
  • 编辑本地文件

这意味着一件关键变化:

👉 AI 不再“告诉你怎么做”,而是“帮你做完”


从自动化到“全流程接管”

更重要的,不是单点能力,而是任务级执行。

Claude 已经具备:

1)流程自动化能力

面对复杂任务,它可以:

  • 打开并编辑本地文档
  • 自动填写复杂电子表格
  • 在多个软件之间串联操作
  • 完成跨工具的工作流

本质上是:

👉 把“人类操作流程”抽象成可执行计划


2)远程遥控:AI成为“代班员工”

配合 Dispatch 功能,用户甚至不需要在电脑前:

  • 用手机发送语音或文本指令
  • Claude 在办公室电脑上执行操作
  • 完成后返回结果

这带来的变化非常直接:

AI 不只是助手,而是一个可以远程调度的“执行节点”


高门槛开放:一次典型的“控制式试水”

目前,这项能力仍然被严格限制:

  • 仅支持 macOS
  • 仅限研究预览(Research Preview)
  • 仅向 Claude Pro / Max 用户开放

这种策略背后,其实是两个现实考量:

1)安全风险仍然不可控

当 AI 拥有:

  • 鼠标控制权
  • 文件读写权限
  • 应用操作能力

任何错误,都可能变成真实损失。


2)产品仍在验证阶段

Anthropic 需要确认:

  • 用户是否真的信任 AI 执行
  • 哪些场景最有价值
  • 错误边界在哪里

👉 这不是一个功能测试,而是在测试“人机信任模型”


关键变化:AI第一次进入“操作系统层”

这次能力升级的本质,是技术栈的下沉:

阶段 AI能力
对话层 回答问题
工具层 调用API
Agent层 执行任务
操作系统层 直接操作电脑

Claude 正在跨入最后一层。

这带来的最大意义是:

👉 绕过所有软件接口,直接接管人类操作路径


为什么这件事如此关键?

因为现实世界的大多数工作,并不存在于 API 中,而存在于:

  • Excel 表格
  • 浏览器后台
  • 企业内部系统
  • 各类“不可编程”的软件

过去 AI 的问题是:

能力很强,但“进不去这些系统”

现在的解法是:

👉 不接入系统,而是“像人一样用系统”


行业共识:AI正在变成“数字劳动力”

从行业视角看,这已经不是 Anthropic 一家的方向:

  • OpenAI:构建 Agent + 文件系统(Library)
  • Meta:布局 Agent 平台与生态
  • Google:将 AI 深度嵌入工作流

所有路径,最终都指向同一个终点:

AI = 可被调度的劳动力


但问题同样尖锐:谁来为“错误操作”负责?

当 AI 开始执行真实操作,一个全新的问题浮现:

  • 删除文件怎么办?
  • 填错数据怎么办?
  • 操作企业系统出错怎么办?

这意味着:

👉 AI 的责任边界,开始从“信息错误”升级为“行为后果”


结语:人机交互的终点,可能是“没有交互”

Claude 的这一步,看起来只是“能动鼠标”。

但它真正改变的是一件更底层的事:

我们还需要亲自操作电脑吗?

当 AI 可以:

  • 理解任务
  • 拆解流程
  • 执行操作
  • 返回结果

未来的工作方式可能变成:

你只说“做什么”,
而不再关心“怎么做”。

当 AI 真正握住鼠标的那一刻,
被重写的,不只是效率边界——

而是整个“软件使用方式”。

5 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私政策 ·  服务条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 23 ms
Developed with Cursor