AI 开始“握住鼠标”：从建议到执行的质变

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

在最新的研究预览中，Claude 已经不再只是停留在对话层，而是可以直接介入桌面环境：

移动指针、点击图标
在不同应用之间切换
操作浏览器、填写表单
编辑本地文件

这意味着一件关键变化：

👉 AI 不再“告诉你怎么做”，而是“帮你做完”

从自动化到“全流程接管”

更重要的，不是单点能力，而是任务级执行。

Claude 已经具备：

1）流程自动化能力

面对复杂任务，它可以：

打开并编辑本地文档
自动填写复杂电子表格
在多个软件之间串联操作
完成跨工具的工作流

本质上是：

👉 把“人类操作流程”抽象成可执行计划

2）远程遥控：AI成为“代班员工”

配合 Dispatch 功能，用户甚至不需要在电脑前：

用手机发送语音或文本指令
Claude 在办公室电脑上执行操作
完成后返回结果

这带来的变化非常直接：

AI 不只是助手，而是一个可以远程调度的“执行节点”

高门槛开放：一次典型的“控制式试水”

目前，这项能力仍然被严格限制：

仅支持 macOS
仅限研究预览（Research Preview）
仅向 Claude Pro / Max 用户开放

这种策略背后，其实是两个现实考量：

1）安全风险仍然不可控

当 AI 拥有：

鼠标控制权
文件读写权限
应用操作能力

任何错误，都可能变成真实损失。

2）产品仍在验证阶段

Anthropic 需要确认：

用户是否真的信任 AI 执行
哪些场景最有价值
错误边界在哪里

👉 这不是一个功能测试，而是在测试“人机信任模型”

关键变化：AI第一次进入“操作系统层”

这次能力升级的本质，是技术栈的下沉：

阶段	AI能力
对话层	回答问题
工具层	调用API
Agent层	执行任务
操作系统层	直接操作电脑

Claude 正在跨入最后一层。

这带来的最大意义是：

👉 绕过所有软件接口，直接接管人类操作路径

为什么这件事如此关键？

因为现实世界的大多数工作，并不存在于 API 中，而存在于：

Excel 表格
浏览器后台
企业内部系统
各类“不可编程”的软件

过去 AI 的问题是：

能力很强，但“进不去这些系统”

现在的解法是：

👉 不接入系统，而是“像人一样用系统”

行业共识：AI正在变成“数字劳动力”

从行业视角看，这已经不是 Anthropic 一家的方向：

OpenAI：构建 Agent + 文件系统（Library）
Meta：布局 Agent 平台与生态
Google：将 AI 深度嵌入工作流

所有路径，最终都指向同一个终点：

AI = 可被调度的劳动力

但问题同样尖锐：谁来为“错误操作”负责？

当 AI 开始执行真实操作，一个全新的问题浮现：

删除文件怎么办？
填错数据怎么办？
操作企业系统出错怎么办？

这意味着：

👉 AI 的责任边界，开始从“信息错误”升级为“行为后果”

结语：人机交互的终点，可能是“没有交互”

Claude 的这一步，看起来只是“能动鼠标”。

但它真正改变的是一件更底层的事：

我们还需要亲自操作电脑吗？

当 AI 可以：

理解任务
拆解流程
执行操作
返回结果

未来的工作方式可能变成：

你只说“做什么”，
而不再关心“怎么做”。

当 AI 真正握住鼠标的那一刻，
被重写的，不只是效率边界——

而是整个“软件使用方式”。

60 次点击 ∙ 0 人收藏

登录后收藏

0 条回复