A Google reforçou significativamente as suas capacidades de IA com o lançamento do Imagen 4, o seu modelo mais avançado de geração de imagens a partir de texto, agora disponível em pré-visualização paga através da Gemini API e do Google AI Studio.
O Imagen 4 representa uma melhoria substancial face às versões anteriores, especialmente na qualidade da renderização de texto nas imagens geradas. O lançamento inclui duas variantes: o modelo Imagen 4 standard, com um custo de $0,04 por imagem gerada, e o Imagen 4 Ultra, a $0,06 por imagem, que oferece maior precisão no seguimento das instruções do utilizador. Ambos os modelos integram a tecnologia de marca de água SynthID, invisível ao olho humano mas que permite identificar conteúdos gerados por IA.
Este lançamento insere-se na expansão mais ampla da família de modelos Gemini 2.5 da Google. A empresa disponibilizou os modelos Gemini 2.5 Flash e Pro após períodos de pré-visualização bem-sucedidos, ao mesmo tempo que introduziu o Gemini 2.5 Flash-Lite em pré-visualização. O Flash-Lite posiciona-se como o modelo 2.5 mais económico e rápido da Google, otimizado para tarefas de elevado volume e sensíveis à latência, como classificação, tradução e encaminhamento inteligente.
Apesar do foco na eficiência, o Gemini 2.5 Flash-Lite mantém as principais capacidades da família 2.5, incluindo uma janela de contexto de 1 milhão de tokens e suporte para ferramentas nativas como integração com a Pesquisa Google e execução de código. Ao contrário de outros modelos da família, que têm as capacidades de raciocínio ativadas por defeito, o Flash-Lite permite aos programadores controlar os orçamentos de raciocínio através de parâmetros da API, estando o raciocínio desativado por defeito para otimizar a velocidade e o custo.
Reforçando ainda mais a sua oferta para programadores, a Google lançou o Gemini CLI, um agente de IA de código aberto que traz o Gemini diretamente para o terminal. Esta ferramenta permite aceder ao Gemini 2.5 Pro através de uma interface de linha de comandos para programação, resolução de problemas e gestão de tarefas. O carácter open-source do Gemini CLI (sob licença Apache 2.0) permite aos programadores inspecionar o código, verificar implicações de segurança e contribuir para o seu desenvolvimento.
Os mais recentes lançamentos de IA da Google demonstram o seu compromisso em disponibilizar aos programadores ferramentas cada vez mais poderosas e flexíveis, adaptadas a diferentes faixas de preço e casos de utilização, desde a geração de imagens de alta qualidade até ao processamento eficiente de texto e assistência baseada em IA no terminal.