Google DeepMind正式发布了Imagen 4,这是其迄今为止最为复杂和先进的文本生成图像模型,为开发者带来了强大的AI视觉创作工具。
此次发布于7月15日通过Gemini API和Google AI Studio同步上线,Imagen 4系列包含两种不同的模型。标准版Imagen 4定价为每张输出图片0.04美元,作为Google面向多种图像生成任务的旗舰产品。而对于需要更高文本提示精确度的复杂应用,Imagen 4 Ultra则提供了增强能力,定价为每张图片0.06美元。
与前代产品相比,Imagen 4实现了重大飞跃。Google强调其在精细细节表现上的“非凡清晰度”,如复杂织物、水珠、动物毛发等。该模型在写实与抽象风格上均表现出色,支持多种宽高比和最高2K分辨率。
尤为值得关注的是,Imagen 4极大提升了AI图像生成领域长期存在的文本渲染难题。这一突破使其在创作营销物料、海报、邀请函、漫画等需要图文结合的视觉内容时极具价值。
Google Labs负责人Josh Woodward表示:“Imagen 4在质量上迈出了巨大一步。我们对文本和字体生成进行了大量关注和修正,因此它非常适合制作幻灯片、邀请函或任何需要图文融合的内容。”
该技术已集成进Google生态系统,包括Workspace办公应用,有望提升各类创意和专业工作流的生产力。Google还透露,未来数周将推出更多计费档位,并可根据需求提供更高的速率限制。此外,公司还计划发布Imagen 4的极速版本,速度有望达到Imagen 3的十倍。