menu
close

Google DeepMind 推出 Veo3,为 AI 视频创作带来声音革新

Google DeepMind 正式将其突破性的 Veo3 视频生成模型全球扩展至 159 个以上国家的 Gemini 用户。该先进 AI 系统可生成高分辨率视频,并实现对话、环境音效与音效的完美同步。Veo3 向 Google AI Pro 与 Ultra 订阅用户开放,标志着 AI 驱动内容创作技术迈出重要一步。
Google DeepMind 推出 Veo3,为 AI 视频创作带来声音革新

Google 已于 2025 年 7 月 3 日完成其尖端 Veo3 视频生成模型的全球部署,使该技术面向全球 159 个以上国家的 Gemini 用户开放。这一扩展被视为 AI 视频创作领域的重要里程碑,Google DeepMind 首席执行官 Demis Hassabis 称其为“视频生成从无声时代走向新纪元”。

Veo3 首次亮相于 2025 年 5 月的 Google I/O 大会,相较前代产品实现了重大飞跃,能够生成带有完全同步音频的高分辨率视频。该模型可生成逼真的对话、环境音效与音效,与视觉内容完美匹配,呈现出极具真实感的效果。视频最高可支持 4K 分辨率,普通用户的标准输出为 720p。

Veo3 的访问权限根据订阅等级有所不同。Google AI Ultra 订阅用户(每月 249.99 美元)可获得该模型全部功能,而 AI Pro 订阅用户(每月 19.99 美元)每天可生成三段 Veo3 Fast 视频,每段最长 8 秒。该技术已集成至 Google 新推出的 AI 影视创作工具 Flow,结合了 Veo3 及 DeepMind 旗下的 Imagen、Gemini 等模型。

为应对深度伪造等安全隐忧,Veo3 引入了多项安全措施。Google 自研的 SynthID 水印技术可在生成帧中嵌入不可见标记,在受控测试中检测准确率高达 99.3%。每段视频还包含符合 C2PA 标准的创作元数据,实现端到端溯源。

业内观察人士指出,Veo3 的应用前景不仅限于娱乐领域。Demis Hassabis 近期在社交媒体上回应有关“可玩世界模型”的讨论时表示“那将会很有趣”,暗示其在游戏领域的潜力。然而,该技术已引发争议。美国媒体监督组织 Media Matters 报道,2025 年 7 月初,TikTok 上出现了部分利用 Veo3 生成的种族主义和反犹主义视频。

Source:

Latest News