当大模型逐渐渗透到数字世界的各类应用,一个更具挑战性的方向正在浮现——如何让 AI 走出屏幕,进入真实物理环境。近日,富士通 宣布与 卡内基梅隆大学 联合成立“物理 AI”研究中心,目标是开发面向自主机器人的操作系统,并计划在 2026 年推出首个版本。
这一合作的意义,不仅在于机器人技术本身,更在于尝试构建“AI 操作系统”这一全新基础设施层,将大模型能力延伸至感知—决策—执行的完整闭环。
当前主流 AI 系统主要处理文本、图像等数字信息,而机器人则需要面对复杂多变的现实环境:不确定性、连续控制、多模态感知等问题远超传统 AI 应用。
“物理 AI(Physical AI)”的提出,本质上是将大模型的推理与规划能力,与机器人控制系统深度融合,使其具备类似人类的环境适应能力。
富士通与卡内基梅隆大学的合作,正是瞄准这一“认知智能 + 物理执行”的融合方向。
不同于传统机器人软件框架,该项目强调“操作系统级”的抽象,其核心目标包括:
从架构上看,这类系统可以理解为:
其目标是让机器人具备“通用能力”,而非仅针对单一场景训练。
将大模型引入机器人系统,核心挑战在于“离散推理”与“连续控制”的衔接。可能涉及的关键技术包括:
此外,系统还需要处理现实环境中的噪声与不确定性,这对模型的鲁棒性提出了更高要求。
富士通设想,该操作系统未来将部署于多个场景,包括:
在演示中,一台四足机器人已能够在移动过程中稳定搬运货物,体现出其在动态环境中的控制能力。
更关键的是,这类系统可以通过环境传感器持续获取数据,实现“在线学习”与能力迭代。
根据规划:
这一时间线表明,行业仍处于从实验验证向工程落地过渡的阶段。
这一项目释放出一个重要趋势:
AI 的竞争正在从模型层,向“操作系统层”上移。
类似于移动互联网时代的 iOS 与 Android,未来的机器人生态也可能围绕若干“AI OS”展开:
在这一框架下,谁掌握操作系统,谁就掌握生态入口。
从 AI 工程视角看,物理 AI 操作系统可以被视为“Agent 的物理扩展”:
这与当前软件 Agent(浏览器操作、代码执行等)形成对照——一个在数字世界,一个在物理世界。
富士通与卡内基梅隆大学的合作,标志着 AI 正在迈向一个更复杂的阶段:不仅要“理解世界”,还要“改变世界”。
当大模型能力逐渐成熟,真正的挑战将转向如何让这些能力在现实环境中可靠运行。而“物理 AI 操作系统”,或许正是连接这两者的关键桥梁。