menu
close

谷歌发布新一代AI工具,助力高级媒体创作

在2025年Google I/O大会上,谷歌推出了突破性的AI视频生成模型Veo 3,首次实现了音画同步生成,包括环境音效和角色对话。同时,谷歌还发布了Imagen 4,能够以惊人的清晰度渲染精细细节,并支持最高2K分辨率。这些先进的AI模型为谷歌全新电影创作工具Flow提供了技术基础,帮助创作者实现电影级视觉表达。
谷歌发布新一代AI工具,助力高级媒体创作

2025年5月20日,在一年一度的I/O开发者大会上,谷歌正式发布了Veo 3和Imagen 4,显著提升了其AI媒体生成能力。

Veo 3是谷歌最新的视频生成模型,首次引入了音频生成功能,实现了重大突破。该模型不仅能生成带有同步背景音效(如交通噪音、鸟鸣等)的视频,还能生成角色之间的对话,并实现精准的唇形同步。Veo 3对现实物理和人物表情的理解也有显著提升,输出的视频更加真实细腻。

与Veo 3一同亮相的还有Imagen 4,这是谷歌迄今为止最先进的图像生成模型。Imagen 4擅长渲染复杂细节,如精致的织物、水珠和动物毛发,画面清晰度极高。该模型支持多种画幅比例,最高可生成2K分辨率的图像,适用于打印和展示。谷歌还计划推出Imagen 4的“极速版”,其生成速度将比前代快10倍,专为快速原型设计和创意流程优化。

这些强大的AI模型共同构建了谷歌全新的AI电影创作工具Flow的核心。Flow集成了Veo、Imagen和Gemini的能力,帮助故事创作者生成电影级片段和场景。该工具提供了Camera Controls(精准镜头控制)、SceneBuilder(无缝扩展镜头)和Asset Management(创意元素管理)等功能,支持角色和场景在多个片段中的一致性,极大提升了叙事连贯性和创作效率。

目前,Veo 3已向美国地区的Google AI Ultra订阅用户开放,月费为249.99美元。Imagen 4则可通过Gemini应用、Whisk、Vertex AI及多款Google Workspace应用访问。所有由这些模型生成的内容均内嵌SynthID水印,以确保透明度并打击虚假信息。

这些技术进步彰显了谷歌不断拓展AI能力、服务更多用户的承诺。谷歌还宣布,Gemini应用的月活跃用户已超过4亿,显示出其AI技术的快速普及和广泛应用。

Source:

Latest News