Sora 被“雪藏”：OpenAI 不做视频生成了，而是在做更危险的事

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

Sora 被“雪藏”：OpenAI 不做视频生成了，而是在做更危险的事，看到这个消息第一反应可能是：

视频生成凉了？

但如果你把 OpenAI 这步棋放到整个 AI 基础设施的演进里看，其实更像是：

👉 主动放弃一个“很火但不赚钱”的赛道，去押一个更底层、更长期的方向

1. Sora 不是做不下去，而是“性价比太差”

先说结论：

👉 视频生成这件事，当前阶段是“算力黑洞”

Sora 的问题本质上不是效果，而是成本结构：

文本 → token（便宜）
图像 → pixel diffusion（中等）
视频 → 时序 + 空间 + consistency（指数级爆炸）

你可以简单理解为：

成本 ≈ 帧数 × 分辨率 × 时长 × 一致性约束

这意味着：

👉 一个用户生成 10 秒视频，可能等价于几十甚至上百次图像生成

而且还带来两个工程灾难：

GPU 长时间占用（无法高并发）
中间状态巨大（显存 / IO 压力爆炸）

2. 为什么“停止 ToC”，而不是优化？

关键在于：

👉 ToC 视频生成是最差的商业模型之一

原因很现实：

（1）用户不愿意为视频生成付高价

生成一次成本高
用户心理价位低（对标短视频免费生态）

结果就是：

👉 毛利模型不成立

（2）推理资源不可复用

和文本模型不同：

ChatGPT：可以高并发、短请求
Sora：长请求 + 高占用 + 难调度

对 infra 来说是灾难：

👉 GPU 利用率反而下降

（3）没有“锁定效应”

视频生成不像代码或 agent：

没有 workflow 绑定
没有长期依赖
没有生态粘性

一句话：

👉 用户用完就走

3. 那 OpenAI 把资源转去哪了？

官方说法是：

world simulation（世界模拟）

这四个字其实信息量很大。

可以拆成三个层级：

① 从“生成内容”到“理解物理世界”

视频生成本质是：

学习像素分布

但 world model 要做的是：

学习物理规律 + 因果关系

比如：

物体运动
碰撞反馈
多主体交互

这件事更接近：

👉 模拟引擎，而不是生成模型

② 从“看起来对”到“真的对”

Sora 的目标：

生成“看起来真实”的视频

world model 的目标：

生成“物理上正确”的世界

差别在于：

Sora：视觉一致性
world model：物理一致性

这直接决定了应用边界：

Sora → 娱乐 / 内容
world model → 机器人 / 自动驾驶 / 仿真

③ 从“内容消费”到“行动决策”

这一步是关键。

一旦模型具备 world simulation 能力，它可以：

预测未来状态
规划行动路径
在虚拟环境中 trial & error

这就是：

👉 Agent + 物理世界 = 机器人智能

4. 为什么这个方向现在变得优先级更高？

因为行业已经在发生迁移。

过去一年：

2025：图像 / 视频生成爆发
2026：重心转向 agent + coding + infra

你可以看到几个明显信号：

👉 Anthropic

主打 Claude Code
强推 agent workflow

👉 OpenAI

强化 tool use / agent
投入 infra（不是单点模型）

👉 整体趋势

生成模型 → 工具模型 → Agent → 系统级智能

而视频生成，停在第一阶段。

5. 一个更现实的解释：算力分配优先级变了

你可以把 OpenAI 内部资源理解为一个池子：

总算力 = 训练 + 推理 + 研究

问题来了：

👉 视频生成占用太多推理资源，但不产生足够价值

所以决策很直接：

砍掉 ToC Sora
回收 GPU
投给更高 ROI 的方向

比如：

agent 推理
coding 模型
world model 训练

6. Sora 的“死亡”，其实是一个行业分水岭

这件事背后其实是一个信号：

👉 “好看”已经不是 AI 的核心竞争力了

下一阶段比的是：

谁能接入真实世界
谁能驱动系统执行
谁能形成闭环

从这个角度看：

👉 Sora 并没有失败，它只是完成了历史使命

证明了一件事：

模型可以生成“看起来真实的世界”

而下一步要解决的是：

模型能不能理解并操作“真实世界”

7. 一个可能被低估的影响

Sora 停掉 ToC，还有一个隐含影响：

👉 视频生成会进一步“平台化 / API 化 / 企业化”

未来更可能是：

不做 consumer app
只做 API（或嵌入工具链）
或直接内嵌在 agent workflow

也就是说：

👉 视频生成不会消失，但会“退居二线”

结尾

如果用一句话总结这件事：

👉 OpenAI 放弃的是一个产品，而不是一个能力

Sora 代表的是：

高成本
低粘性
弱闭环

而 world simulation 代表的是：

高壁垒
强长期价值
可进入物理世界

这不是收缩，而是：

👉 从“做内容”切换到“做世界”。

72 次点击 ∙ 0 人收藏

登录后收藏

0 条回复