谷歌发布新一代AI工具，助力高级媒体创作

在2025年Google I/O大会上，谷歌推出了突破性的AI视频生成模型Veo 3，首次实现了音画同步生成，包括环境音效和角色对话。同时，谷歌还发布了Imagen 4，能够以惊人的清晰度渲染精细细节，并支持最高2K分辨率。这些先进的AI模型为谷歌全新电影创作工具Flow提供了技术基础，帮助创作者实现电影级视觉表达。

2025年5月20日，在一年一度的I/O开发者大会上，谷歌正式发布了Veo 3和Imagen 4，显著提升了其AI媒体生成能力。

Veo 3是谷歌最新的视频生成模型，首次引入了音频生成功能，实现了重大突破。该模型不仅能生成带有同步背景音效（如交通噪音、鸟鸣等）的视频，还能生成角色之间的对话，并实现精准的唇形同步。Veo 3对现实物理和人物表情的理解也有显著提升，输出的视频更加真实细腻。

与Veo 3一同亮相的还有Imagen 4，这是谷歌迄今为止最先进的图像生成模型。Imagen 4擅长渲染复杂细节，如精致的织物、水珠和动物毛发，画面清晰度极高。该模型支持多种画幅比例，最高可生成2K分辨率的图像，适用于打印和展示。谷歌还计划推出Imagen 4的“极速版”，其生成速度将比前代快10倍，专为快速原型设计和创意流程优化。

这些强大的AI模型共同构建了谷歌全新的AI电影创作工具Flow的核心。Flow集成了Veo、Imagen和Gemini的能力，帮助故事创作者生成电影级片段和场景。该工具提供了Camera Controls（精准镜头控制）、SceneBuilder（无缝扩展镜头）和Asset Management（创意元素管理）等功能，支持角色和场景在多个片段中的一致性，极大提升了叙事连贯性和创作效率。

目前，Veo 3已向美国地区的Google AI Ultra订阅用户开放，月费为249.99美元。Imagen 4则可通过Gemini应用、Whisk、Vertex AI及多款Google Workspace应用访问。所有由这些模型生成的内容均内嵌SynthID水印，以确保透明度并打击虚假信息。

这些技术进步彰显了谷歌不断拓展AI能力、服务更多用户的承诺。谷歌还宣布，Gemini应用的月活跃用户已超过4亿，显示出其AI技术的快速普及和广泛应用。

Source:

谷歌发布新一代AI工具，助力高级媒体创作

Latest News

字节跳动豆包AI现已支持实时视频辅助功能

一加弃用三段式开关，推出AI驱动的Plus Key按键

德国科技巨头联合竞逐欧盟支持的AI超级工厂

美国检方调查Builder.ai，微软支持的15亿美元AI初创公司破产前夕风暴再起

挪威1.8万亿美元主权基金：AI应用成为员工“硬性要求”

OpenTools.ai 推出面向科技专业人士的 AI 新闻聚合平台

谷歌通过Gemini向开发者开放AI计算机控制能力

Google为Gemini模型引入透明化思维摘要功能

谷歌发布新一代AI工具，助力高级媒体创作

Related Articles

字节跳动豆包AI现已支持实时视频辅助功能

谷歌通过Gemini向开发者开放AI计算机控制能力

Google为Gemini模型引入透明化思维摘要功能

谷歌将AI成本控制功能扩展至Gemini 2.5 Pro

Google借助Gemini AI翻译重启智能眼镜项目

Latest News

字节跳动豆包AI现已支持实时视频辅助功能

一加弃用三段式开关，推出AI驱动的Plus Key按键

德国科技巨头联合竞逐欧盟支持的AI超级工厂

美国检方调查Builder.ai，微软支持的15亿美元AI初创公司破产前夕风暴再起

挪威1.8万亿美元主权基金：AI应用成为员工“硬性要求”

OpenTools.ai 推出面向科技专业人士的 AI 新闻聚合平台

谷歌通过Gemini向开发者开放AI计算机控制能力

Google为Gemini模型引入透明化思维摘要功能