据知情人士透露,OpenAI 正计划在 ChatGPT 平台中整合其 AI 视频生成工具 Sora。如果这一计划落地,ChatGPT 将从以文本和图片为主的 AI 助手,进一步扩展为一个 完整的多模态内容生成平台。
这一变化意味着,用户未来在 ChatGPT 中不仅可以生成文字和图片,还可能直接生成 AI 视频内容。
Sora 最早在 2025 年 9 月以独立应用的形式推出。上线初期,这款 AI 视频生成工具获得了相当高的关注度,并迅速登上 苹果 App Store 下载榜首。
不过随着时间推移,Sora 的用户活跃度有所下降,目前在应用商店中的排名已经降至 第 165 位左右。
在这种背景下,将 Sora 整合进 ChatGPT,可能是 OpenAI 推动其重新增长的一种策略。相比独立应用,ChatGPT 拥有更庞大的用户基础,能够为视频生成能力提供更稳定的使用场景。
如果 Sora 集成成功,ChatGPT 的能力结构将进一步扩展:
用户可以在一个界面中完成:
这意味着 ChatGPT 正在从一个聊天工具逐渐转变为 统一的 AI 创作平台。
例如用户只需输入一句描述:
“生成一段介绍火星探索的短视频。”
系统就可能自动完成:
这种能力对于内容创作、广告制作以及短视频生产都有潜在影响。
不过,视频生成模型带来的一个现实问题是 成本极高。
相比文本模型,视频模型需要处理:
业内估算显示,如果多模态能力全面普及,从现在到 2030 年,相关 AI 推理成本可能超过 2250 亿美元。
因此,即使 Sora 被整合进 ChatGPT,也很可能会以:
等方式提供服务。
过去两年,生成式 AI 的主战场主要集中在:
而接下来,视频生成很可能成为新的技术前沿。
原因在于视频内容具有更强的信息密度,也更接近真实世界的表达方式。
如果 AI 可以稳定生成高质量视频,那么很多行业都会受到影响,例如:
OpenAI 将 Sora 接入 ChatGPT,本质上也是在为这一趋势提前布局。未来的 AI 产品,很可能不再区分文本、图片或视频,而是成为 统一的多模态内容生成系统。