menu
close

Google lança Imagen 4 e amplia linha Gemini 2.5

O Google lançou o Imagen 4, seu modelo de geração de imagens a partir de texto mais avançado até o momento, disponível em prévia paga via Gemini API e Google AI Studio. O lançamento ocorre junto à disponibilidade geral dos modelos Gemini 2.5 Flash e Pro, além da introdução do Gemini 2.5 Flash-Lite, o modelo mais rápido e econômico da família 2.5. Desenvolvedores também podem acessar o Gemini diretamente pelo terminal com o novo Gemini CLI, que é open source.
Google lança Imagen 4 e amplia linha Gemini 2.5

O Google expandiu significativamente suas capacidades de IA com o lançamento do Imagen 4, seu modelo mais avançado de geração de imagens a partir de texto, agora disponível em prévia paga por meio da Gemini API e do Google AI Studio.

O Imagen 4 representa um avanço substancial em relação às versões anteriores, especialmente na qualidade da renderização de textos dentro das imagens geradas. O lançamento inclui duas variantes: o modelo padrão do Imagen 4, com preço de US$ 0,04 por imagem gerada, e o Imagen 4 Ultra, a US$ 0,06 por imagem, que oferece maior precisão no cumprimento das instruções do usuário. Ambos os modelos contam com a tecnologia de marca d'água SynthID, invisível ao olho humano, mas que ajuda a identificar conteúdos gerados por IA.

Esse lançamento faz parte da ampliação da família de modelos Gemini 2.5 do Google. A empresa tornou os modelos Gemini 2.5 Flash e Pro disponíveis de forma geral após períodos de prévia bem-sucedidos, além de apresentar o Gemini 2.5 Flash-Lite em prévia. O Flash-Lite é posicionado como o modelo 2.5 mais rápido e econômico do Google, otimizado para tarefas de alto volume e baixa latência, como classificação, tradução e roteamento inteligente.

Apesar do foco em eficiência, o Gemini 2.5 Flash-Lite mantém as principais capacidades da família 2.5, incluindo uma janela de contexto de 1 milhão de tokens e suporte a ferramentas nativas como integração com o Google Search e execução de código. Diferentemente dos outros modelos da família, que têm capacidades de "raciocínio" ativadas por padrão, o Flash-Lite permite que desenvolvedores controlem o orçamento de raciocínio por parâmetros da API, com o raciocínio desativado por padrão para otimizar velocidade e custo.

Reforçando ainda mais sua oferta para desenvolvedores, o Google lançou o Gemini CLI, um agente de IA open source que leva o Gemini diretamente ao terminal. Essa ferramenta permite acessar o Gemini 2.5 Pro por interface de linha de comando para programação, resolução de problemas e gerenciamento de tarefas. O caráter open source do Gemini CLI (sob licença Apache 2.0) permite que desenvolvedores inspecionem o código, verifiquem questões de segurança e contribuam para seu desenvolvimento.

Os lançamentos mais recentes de IA do Google demonstram o compromisso da empresa em oferecer aos desenvolvedores ferramentas cada vez mais poderosas e flexíveis, atendendo a diferentes faixas de preço e casos de uso — desde geração de imagens de alta qualidade até processamento eficiente de texto e assistência por IA diretamente no terminal.

Source:

Latest News