OpenAI 计划将视频生成模型 Sora 接入 ChatGPT

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

据知情人士透露，OpenAI 正计划在 ChatGPT 平台中整合其 AI 视频生成工具 Sora。如果这一计划落地，ChatGPT 将从以文本和图片为主的 AI 助手，进一步扩展为一个 完整的多模态内容生成平台。

这一变化意味着，用户未来在 ChatGPT 中不仅可以生成文字和图片，还可能直接生成 AI 视频内容。

从独立应用到平台功能

Sora 最早在 2025 年 9 月以独立应用的形式推出。上线初期，这款 AI 视频生成工具获得了相当高的关注度，并迅速登上 苹果 App Store 下载榜首。

不过随着时间推移，Sora 的用户活跃度有所下降，目前在应用商店中的排名已经降至 第 165 位左右。

在这种背景下，将 Sora 整合进 ChatGPT，可能是 OpenAI 推动其重新增长的一种策略。相比独立应用，ChatGPT 拥有更庞大的用户基础，能够为视频生成能力提供更稳定的使用场景。

如果 Sora 集成成功，ChatGPT 的能力结构将进一步扩展：

用户可以在一个界面中完成：

这意味着 ChatGPT 正在从一个聊天工具逐渐转变为 统一的 AI 创作平台。

例如用户只需输入一句描述：

“生成一段介绍火星探索的短视频。”

系统就可能自动完成：

这种能力对于内容创作、广告制作以及短视频生产都有潜在影响。

不过，视频生成模型带来的一个现实问题是 成本极高。

相比文本模型，视频模型需要处理：

业内估算显示，如果多模态能力全面普及，从现在到 2030 年，相关 AI 推理成本可能超过 2250 亿美元。

因此，即使 Sora 被整合进 ChatGPT，也很可能会以：

等方式提供服务。

过去两年，生成式 AI 的主战场主要集中在：

而接下来，视频生成很可能成为新的技术前沿。

原因在于视频内容具有更强的信息密度，也更接近真实世界的表达方式。

如果 AI 可以稳定生成高质量视频，那么很多行业都会受到影响，例如：

OpenAI 将 Sora 接入 ChatGPT，本质上也是在为这一趋势提前布局。未来的 AI 产品，很可能不再区分文本、图片或视频，而是成为 统一的多模态内容生成系统。

75 次点击 ∙ 0 人收藏

登录后收藏

0 条回复