【旧金山讯】 AI 领域的军备竞赛正在从“大脑”延伸至“感官”。今日,Anthropic 官方宣布已完成对高精度视觉识别初创公司 Vercept 的收购。这一举动被外界视为 Anthropic 针对其“Computer Use”(计算机使用)功能的重磅升级,意在彻底解决 AI 智能体在复杂 UI 环境中“看不准、点不对”的痛点。
尽管 Claude 此前已具备一定的视觉能力,但在面对拥有数千个按钮、嵌套菜单和动态图表的专业软件(如 CAD、复杂 ERP 系统)时,识别精度依然面临挑战。
Vercept 的核心技术在于其独特的语义级 UI 解析架构。它不仅仅是将屏幕看作一张图片,而是能够实时理解每一个控件的功能属性、层级关系以及交互逻辑。此次收购后,Claude 将不再依赖低频的屏幕截图,而是能够以“类人”的直觉精准定位每一个像素点,极大地降低了操作失误率。
Anthropic 去年推出的 “Computer Use” 功能曾震惊业界,但其商用化的最大瓶颈在于执行的稳定性。通过整合 Vercept 的技术,Claude 将获得以下进化:
* 极端环境适应性:在低分辨率、非标准 UI 或深色模式下,依然能保持 99% 以上的元素识别率。
* 低延迟交互:优化的识别算法将显著降低 AI 思考与操作之间的时延。
* 跨平台连贯性:无论是 Web 端、原生桌面端还是复杂的虚拟桌面环境,Claude 都能实现无缝的控制切换。
随着 OpenAI 的 “Operator” 和微软的 “Recall” 竞相发力,2026 年已成为“AI 代理元年”。此前,Anthropic 的模型以逻辑严密著称,而此次收购 Vercept 补齐了其感官上的短板,使其在“端到端任务执行”上占据了显著的技术高地。
硅谷分析人士指出,Anthropic 此举释放了一个清晰信号:未来的顶级 AI 不再仅仅是会聊天的屏幕黑盒,而是能够真正接管用户鼠标与键盘、在真实办公环境中替代人类完成复杂操作的“数字雇员”。
随着 Vercept 技术的并入,下一阶段的 Claude 更新预计将大幅强化其在金融建模、软件测试及自动化创意设计领域的表现。当 AI 拥有了精准的“眼睛”,人类与计算机的交互逻辑或许将迎来 40 年来最彻底的一次翻转。