在“AI 是否会颠覆智能手机”的讨论持续升温之际,Perplexity AI CEO Aravind Srinivas 给出了一个相对冷静的判断:至少在可预见的阶段,AI 不会取代 iPhone,真正发生变化的是“能力层”,而非“设备形态”。
这一观点对 AI 技术社区具有重要参考价值——它重新界定了大模型、Agent 与终端设备之间的关系:不是替代,而是重构。
围绕 AI 硬件的讨论,从 Humane、Rabbit 到各类 AI Pin 设备,一度指向一个激进命题:智能手机会被新一代 AI 设备取代。
但现实进展并不支持这一叙事。
Srinivas 指出,用户依然依赖手机完成一系列“不可替代”的基础能力:
摄像头与多模态采集(图像 / 视频 / 音频)
通信能力(蜂窝网络、即时通讯)
支付与身份认证(NFC、生物识别)
定位与导航(GPS + 传感器融合)
应用生态(App Store 分发体系)
这些能力构成了一个高度集成的“个人计算节点”,而当前 AI 并没有提供更优的替代方案。
换句话说,AI 正在改变“你如何使用手机”,但尚未改变“你是否需要手机”。
如果不从硬件替代,而从系统架构看,这一趋势可以理解为一次“分层重构”。
以 iPhone 为代表的智能手机,本质上是一个成熟的 App 操作系统(App-centric OS):
用户通过图标启动应用
每个应用拥有独立数据与交互逻辑
系统负责权限隔离与资源调度
而大模型正在引入一个新的抽象层:Agent Layer(智能代理层)。
这一层具备几个关键特征:
自然语言驱动:用户不再需要记住 App 路径,而是通过意图表达
跨应用编排:通过 function calling 或 tool use 调用多个服务
上下文记忆:持续跟踪用户状态,而非单次交互
多模态输入输出:融合语音、图像、文本进行理解与生成
例如,一个典型请求可能从“打开外卖 App 点餐”,演变为一句话:“帮我点一份上次那家寿司,30 分钟后送到公司”。
背后涉及:
历史数据检索
地理位置解析
多应用 API 调用
支付流程触发
这正是 Agent 的核心能力,而非传统 App 的能力边界。
尽管 Agent 能力在快速演进,但独立 AI 硬件面临几个结构性问题:
智能手机已经完成高度集成:
SoC(CPU + GPU + NPU)
摄像头阵列
多种无线通信模块
新设备要复制这一体系,不仅成本高昂,还涉及供应链与系统优化问题。
以 Apple 和 Google 为代表的厂商,已经建立起成熟的 OS + 应用生态:
iOS / Android 的开发者体系
数百万级应用分发
完整的权限与安全框架
AI 硬件如果无法接入这一生态,就会陷入“能力孤岛”。
用户已经形成稳定的设备使用习惯:
随身携带手机
高频解锁与交互
多任务切换
任何新设备,都必须提供“显著优于手机”的体验,才可能改变这一行为模式——而目前 AI 设备尚未做到这一点。
更现实的路径,是 AI 成为手机系统的“默认能力层”。
这已经在发生:
Gemini 深度嵌入 Android,提供系统级 Agent 能力
Siri 正在向 LLM 驱动升级
ChatGPT 被集成进多种操作系统与应用中
从架构角度看,这类似于:
过去:OS → App → User
现在:OS → Agent → App → User
Agent 成为新的“中间层”,负责理解用户意图并调度底层服务。
这一趋势对开发者意味着几个关键变化:
传统开发关注 API 设计,而未来需要考虑:
如何让服务被 LLM 调用(schema、tool 描述)
如何设计可组合的能力模块(composable services)
如何处理不确定性调用(probabilistic execution)
Agent 需要长期记忆与上下文:
用户偏好
历史行为
环境状态(时间、位置、设备)
这对数据建模与隐私保护提出更高要求。
未来系统可能同时调用多个模型:
本地小模型(低延迟)
云端大模型(高能力)
专用模型(视觉、语音)
如何进行模型路由(model routing)与结果融合,将成为关键工程问题。
Srinivas 的判断,本质上是在为当前的 AI 叙事降温:
短期内,AI 不会创造一个替代手机的新物种,但会彻底改变手机的使用范式。
从产业视角看,这意味着:
硬件层:格局稳定,演进缓慢
系统层:竞争加剧,AI 深度融合
应用层:被 Agent 重构,入口重新分配
真正的变量,不是“下一台设备是什么”,而是:
谁能成为用户与设备之间的那一层智能接口。