O Google aprimorou de forma discreta, mas significativa, seu modelo Imagen 4 Ultra, consolidando-o como um dos principais sistemas de geração de imagens por IA do mundo. O modelo atualizado agora ocupa a terceira posição no ranking Image Arena da Artificial Analysis, tornando-se um concorrente direto dos líderes do setor: GPT-4o da OpenAI e Seedream 3.0 da ByteDance.
Apresentado pela primeira vez no Google I/O 2025, em maio, o Imagen 4 Ultra representa um avanço substancial em relação à versão anterior. O modelo se destaca na renderização de detalhes complexos, como texturas de tecidos, gotas d’água e pelos de animais, com impressionante clareza. Usuários relataram melhorias significativas tanto em estilos de imagem fotorrealistas quanto abstratos, sendo possível gerar imagens em resoluções de até 2K.
Uma das melhorias mais notáveis do Imagen 4 Ultra resolve um antigo desafio da geração de imagens por IA: a renderização de texto. O modelo apresenta capacidades tipográficas muito superiores, tornando-se especialmente útil para a criação de cartões comemorativos, pôsteres e outros designs que combinam imagens e texto.
O Google disponibilizou o Imagen 4 Ultra em diversos canais, incluindo o aplicativo Gemini, o Google AI Studio e o Vertex AI para clientes corporativos. Com um preço de US$ 0,06 por imagem gerada, o modelo oferece uma estrutura de preços competitiva em relação ao GPT-4o, que custa aproximadamente US$ 0,17 por imagem, além de entregar resultados em cerca de 9,5 segundos, contra 53 segundos do GPT-4o.
A atualização sinaliza a determinação do Google em competir no mais alto nível do setor de IA generativa. Segundo analistas do mercado, o contínuo aprimoramento da família Imagen pelo Google DeepMind demonstra o compromisso da empresa em expandir os limites do que é possível em conteúdo visual gerado por IA.
Para o futuro, o Google indicou que as próximas atualizações do Imagen 4 Ultra terão foco na incorporação do feedback dos usuários para refinar ainda mais as capacidades do modelo, além de esforços para reduzir a latência de geração. A empresa também está desenvolvendo uma versão “Fast” do Imagen 4, que promete ser até 10 vezes mais rápida que o Imagen 3, ampliando ainda mais sua utilidade para aplicações em tempo real.