Google发布Imagen 4，革新文本渲染能力

Google于2025年7月15日正式发布了迄今为止最先进的文本生成图像AI模型——Imagen 4，并通过Gemini API和Google AI Studio向开发者开放。新一代模型在图像质量上取得了显著提升，尤其是在文本渲染方面，并推出了两种不同的模型变体以满足多样化的创意需求。该技术可根据文本描述生成高度细致的视觉内容，广泛应用于设计、营销、娱乐等创意领域。

Google DeepMind正式发布了Imagen 4，这是其迄今为止最为复杂和先进的文本生成图像模型，为开发者带来了强大的AI视觉创作工具。

此次发布于7月15日通过Gemini API和Google AI Studio同步上线，Imagen 4系列包含两种不同的模型。标准版Imagen 4定价为每张输出图片0.04美元，作为Google面向多种图像生成任务的旗舰产品。而对于需要更高文本提示精确度的复杂应用，Imagen 4 Ultra则提供了增强能力，定价为每张图片0.06美元。

与前代产品相比，Imagen 4实现了重大飞跃。Google强调其在精细细节表现上的“非凡清晰度”，如复杂织物、水珠、动物毛发等。该模型在写实与抽象风格上均表现出色，支持多种宽高比和最高2K分辨率。

尤为值得关注的是，Imagen 4极大提升了AI图像生成领域长期存在的文本渲染难题。这一突破使其在创作营销物料、海报、邀请函、漫画等需要图文结合的视觉内容时极具价值。

Google Labs负责人Josh Woodward表示：“Imagen 4在质量上迈出了巨大一步。我们对文本和字体生成进行了大量关注和修正，因此它非常适合制作幻灯片、邀请函或任何需要图文融合的内容。”

该技术已集成进Google生态系统，包括Workspace办公应用，有望提升各类创意和专业工作流的生产力。Google还透露，未来数周将推出更多计费档位，并可根据需求提供更高的速率限制。此外，公司还计划发布Imagen 4的极速版本，速度有望达到Imagen 3的十倍。

Source:

Google发布Imagen 4，革新文本渲染能力

Latest News

谷歌发布超高效 Gemini 2.5 Flash-Lite，专为成本敏感型 AI 场景打造

Google 推出 Gemini CLI：为开发者终端打造的 AI 助手

谷歌AI以突破性检测工具革新癌症护理

谷歌端侧AI为机器人带来自主智能

企业缺乏 AI 时代成功所需的关键人类技能

VentureBeat发布2025年AI市场重大变革分析报告

OpenAI发布GPT-5：多项AI能力将统一于单一强大模型

Meta的148亿美元AI豪赌：绝望之举还是战略天才？

科技巨头拥抱核能以满足AI的能源需求

Dailymotion发布AI驱动视频平台，开启行业变革

Google发布Imagen 4，革新文本渲染能力

Related Articles

谷歌端侧AI为机器人带来自主智能

Google 推出 Gemini CLI：为开发者终端打造的 AI 助手

谷歌发布超高效 Gemini 2.5 Flash-Lite，专为成本敏感型 AI 场景打造

月之暗面的万亿参数Kimi K2挑战AI巨头

Google 扩展 Gemini Live，深化应用集成

Latest News

谷歌发布超高效 Gemini 2.5 Flash-Lite，专为成本敏感型 AI 场景打造

Google 推出 Gemini CLI：为开发者终端打造的 AI 助手

谷歌AI以突破性检测工具革新癌症护理

谷歌端侧AI为机器人带来自主智能

企业缺乏 AI 时代成功所需的关键人类技能

VentureBeat发布2025年AI市场重大变革分析报告

OpenAI发布GPT-5：多项AI能力将统一于单一强大模型

Meta的148亿美元AI豪赌：绝望之举还是战略天才？

科技巨头拥抱核能以满足AI的能源需求

Dailymotion发布AI驱动视频平台，开启行业变革