📌 事件亮点
- 谷歌正在利用涵盖约 200 亿条视频的 YouTube 庞大库,训练其 AI 模型,包括文本生成的 Gemini 以及新一代视频生成器 Veo 3。
- 官方证实,这些视频符合与创作者和媒体公司的协议,并非全面使用,仅采用了视频库的一部分进行训练。
- 尽管规模不明,但即便只使用 1% 的视频(日量视频量约 2.3 亿分钟),数据量就相当于同类 AI 模型训练数据的 40 多倍。
🎧 训练优势与争议背景
- YouTube 视频语音内容、视觉动态、环境变化等特征,能显著丰富 AI 模型对真实场景的理解,提升视频和音频生成的真实感与自然性。
- 该训练方式引发争议,一些视频创作者担心其内容被用于训练 AI 模型后,会被“潜在替代”,但 YouTube 表示此做法符合既定协议,并为创作者提供拒绝选项。
🔧 Veo 3 模型与 Shorts 整合
- Veo 3 是 Google DeepMind 最新的多模态视频模型,可生成 8 秒带音频短视频,兼容视觉与语音表达。
- YouTube 表示将在今年夏季,把 Veo 3 集成到 Shorts 功能中,通过 Gemini Pro 或 Ultra 订阅提供访问。
- YouTube 首席执行官 Neal Mohan 在戛纳狮子节上宣布 Veo 3 将成为 Shorts 的新功能,为创作者带来更多视频生成方式。
⚠️ 剥离风险与未来趋势
- 此举突显谷歌利用内部数据资源进行 AI 训练的策略优势,但也激化了关于“内容使用与创作者权益保护”之间的伦理和监管争议。
- 尽管用户可通过 YouTube 设置拒绝将视频用于训练,但创作者普遍表示对大规模训练缺乏透明感与主动控制权。
- 未来,行业或将出现更细化的授权机制和版权制度,以平衡创作者权益与 AI 模型训练需要。
✅ 小结
谷歌借力 YouTube 几近无限的视频资源,提升其 Gemini 和 Veo 3 模型的性能与表现力,同时推动 AI 视频工具向主流化迈进。
但背后也揭示出创作者权益保护、数据使用透明和平台责任之间的冲突,或将成为 AI 发展的重要监管考量点。
🔗 参考来源
- CNBC 报道(英文版):Google 利用 YouTube 视频训练 AI 模型
https://www.cnbc.com/2025/06/19/google-youtube-ai-training-veo-3.html
- iPhone in Canada 报道:Google 正用 YouTube 视频训练 Gemini 和 Veo 3 AI
https://www.iphoneincanada.ca/2025/06/19/google-using-youtube-to-train-ai/