Sora 被“雪藏”:OpenAI 不做视频生成了,而是在做更危险的事,看到这个消息第一反应可能是:
视频生成凉了?
但如果你把 OpenAI 这步棋放到整个 AI 基础设施的演进里看,其实更像是:
👉 主动放弃一个“很火但不赚钱”的赛道,去押一个更底层、更长期的方向
先说结论:
👉 视频生成这件事,当前阶段是“算力黑洞”
Sora 的问题本质上不是效果,而是成本结构:
你可以简单理解为:
成本 ≈ 帧数 × 分辨率 × 时长 × 一致性约束
这意味着:
👉 一个用户生成 10 秒视频,可能等价于几十甚至上百次图像生成
而且还带来两个工程灾难:
关键在于:
👉 ToC 视频生成是最差的商业模型之一
原因很现实:
结果就是:
👉 毛利模型不成立
和文本模型不同:
对 infra 来说是灾难:
👉 GPU 利用率反而下降
视频生成不像代码或 agent:
一句话:
👉 用户用完就走
官方说法是:
world simulation(世界模拟)
这四个字其实信息量很大。
可以拆成三个层级:
视频生成本质是:
学习像素分布
但 world model 要做的是:
学习物理规律 + 因果关系
比如:
这件事更接近:
👉 模拟引擎,而不是生成模型
Sora 的目标:
生成“看起来真实”的视频
world model 的目标:
生成“物理上正确”的世界
差别在于:
这直接决定了应用边界:
这一步是关键。
一旦模型具备 world simulation 能力,它可以:
这就是:
👉 Agent + 物理世界 = 机器人智能
因为行业已经在发生迁移。
过去一年:
你可以看到几个明显信号:
生成模型 → 工具模型 → Agent → 系统级智能
而视频生成,停在第一阶段。
你可以把 OpenAI 内部资源理解为一个池子:
总算力 = 训练 + 推理 + 研究
问题来了:
👉 视频生成占用太多推理资源,但不产生足够价值
所以决策很直接:
比如:
这件事背后其实是一个信号:
👉 “好看”已经不是 AI 的核心竞争力了
下一阶段比的是:
从这个角度看:
👉 Sora 并没有失败,它只是完成了历史使命
证明了一件事:
模型可以生成“看起来真实的世界”
而下一步要解决的是:
模型能不能理解并操作“真实世界”
Sora 停掉 ToC,还有一个隐含影响:
👉 视频生成会进一步“平台化 / API 化 / 企业化”
未来更可能是:
也就是说:
👉 视频生成不会消失,但会“退居二线”
如果用一句话总结这件事:
👉 OpenAI 放弃的是一个产品,而不是一个能力
Sora 代表的是:
而 world simulation 代表的是:
这不是收缩,而是:
👉 从“做内容”切换到“做世界”。