谷歌近日低调但大幅度地升级了其 Imagen 4 Ultra 模型,使其成为全球顶尖的 AI 图像生成系统之一。增强后的模型目前在 Artificial Analysis 的 Image Arena 排行榜中位列第三,成为 OpenAI 的 GPT-4o 和字节跳动的 Seedream 3.0 的直接竞争对手。
Imagen 4 Ultra 首次亮相于 2025 年 5 月的 Google I/O 大会,相较前代产品有了显著进步。该模型在渲染诸如织物纹理、水珠和动物毛发等复杂细节方面表现出色,清晰度极高。用户普遍反映,无论是照片级真实感还是抽象风格的图像,模型均有显著提升,且支持最高 2K 分辨率的图像生成。
Imagen 4 Ultra 最引人注目的改进之一,是对 AI 图像生成领域长期存在的难题——文本渲染能力的突破。该模型在字体排版方面有了极大提升,尤其适用于贺卡、海报等需要将图像与文字结合的设计场景。
谷歌已通过多种渠道开放 Imagen 4 Ultra,包括 Gemini 应用、Google AI Studio 以及面向企业客户的 Vertex AI。每张输出图片收费 0.06 美元,相较于 GPT-4o 每张约 0.17 美元的价格更具竞争力,同时生成一张图片仅需约 9.5 秒,而 GPT-4o 约需 53 秒。
此次升级彰显了谷歌在生成式 AI 领域与顶级厂商竞争的决心。业内分析师指出,谷歌 DeepMind 对 Imagen 系列的持续优化,体现了公司不断突破 AI 视觉内容生成边界的承诺。
展望未来,谷歌表示,Imagen 4 Ultra 的后续更新将重点采纳用户反馈,进一步提升模型能力,同时致力于降低生成延迟。此外,公司还在开发“Fast”版本的 Imagen 4,预计其速度将比 Imagen 3 快 10 倍,有望进一步提升其实时应用价值。