A Google DeepMind lançou oficialmente o Imagen 4, o seu modelo de geração de imagens a partir de texto mais sofisticado até ao momento, oferecendo aos programadores novas ferramentas poderosas para criar visuais gerados por IA.
O lançamento, disponível desde 15 de julho através da API Gemini e do Google AI Studio, introduz dois modelos distintos na família Imagen 4. O modelo standard, Imagen 4, com um preço de 0,04 dólares por imagem gerada, é a principal oferta da Google para uma vasta gama de tarefas de geração de imagens. Para aplicações mais exigentes, que requerem uma correspondência precisa com os prompts de texto, o Imagen 4 Ultra oferece capacidades reforçadas por 0,06 dólares por imagem.
O Imagen 4 representa um avanço significativo em relação ao seu antecessor, com a Google a destacar a sua "notável clareza em detalhes finos", como tecidos intrincados, gotas de água e pelo de animais. O modelo destaca-se tanto em estilos fotorrealistas como abstratos, suportando vários rácios de aspeto e resoluções até 2K.
Talvez mais relevante, o Imagen 4 resolve um desafio persistente na geração de imagens por IA, graças à sua melhoria dramática na renderização de texto. Esta evolução torna a tecnologia especialmente valiosa para criar materiais de marketing, cartazes, convites, bandas desenhadas e outros visuais que combinam imagem e texto.
"O Imagen 4 é um enorme avanço em termos de qualidade", referiu Josh Woodward, responsável pelo grupo Labs da Google. "Dedicámos muita atenção e correções à forma como gera texto e tipografia, por isso é excelente para criar apresentações, convites ou qualquer outro material onde seja necessário combinar imagem e texto."
A integração desta tecnologia no ecossistema da Google, incluindo as aplicações do Workspace, posiciona-a para potenciar a produtividade em vários fluxos de trabalho criativos e profissionais. A Google indicou que, nas próximas semanas, serão introduzidos novos escalões de faturação, com limites de utilização superiores disponíveis mediante pedido. A empresa planeia ainda lançar uma variante mais rápida do Imagen 4, que poderá operar até dez vezes mais rápido do que o Imagen 3.