Google 已于 2025 年 7 月 3 日完成其尖端 Veo3 视频生成模型的全球部署,使该技术面向全球 159 个以上国家的 Gemini 用户开放。这一扩展被视为 AI 视频创作领域的重要里程碑,Google DeepMind 首席执行官 Demis Hassabis 称其为“视频生成从无声时代走向新纪元”。
Veo3 首次亮相于 2025 年 5 月的 Google I/O 大会,相较前代产品实现了重大飞跃,能够生成带有完全同步音频的高分辨率视频。该模型可生成逼真的对话、环境音效与音效,与视觉内容完美匹配,呈现出极具真实感的效果。视频最高可支持 4K 分辨率,普通用户的标准输出为 720p。
Veo3 的访问权限根据订阅等级有所不同。Google AI Ultra 订阅用户(每月 249.99 美元)可获得该模型全部功能,而 AI Pro 订阅用户(每月 19.99 美元)每天可生成三段 Veo3 Fast 视频,每段最长 8 秒。该技术已集成至 Google 新推出的 AI 影视创作工具 Flow,结合了 Veo3 及 DeepMind 旗下的 Imagen、Gemini 等模型。
为应对深度伪造等安全隐忧,Veo3 引入了多项安全措施。Google 自研的 SynthID 水印技术可在生成帧中嵌入不可见标记,在受控测试中检测准确率高达 99.3%。每段视频还包含符合 C2PA 标准的创作元数据,实现端到端溯源。
业内观察人士指出,Veo3 的应用前景不仅限于娱乐领域。Demis Hassabis 近期在社交媒体上回应有关“可玩世界模型”的讨论时表示“那将会很有趣”,暗示其在游戏领域的潜力。然而,该技术已引发争议。美国媒体监督组织 Media Matters 报道,2025 年 7 月初,TikTok 上出现了部分利用 Veo3 生成的种族主义和反犹主义视频。