menu
close

Google Lança Gemini 2.5 Flash com Capacidades Avançadas de Raciocínio

O Google lançou o Gemini 2.5 Flash em modo de prévia, trazendo melhorias significativas para seu modelo de IA rápido e econômico. Esta nova versão introduz capacidades de raciocínio híbrido que permitem aos desenvolvedores controlar o processo de pensamento do modelo, mantendo velocidade e eficiência. A prévia já está disponível no Google AI Studio, Vertex AI e no app Gemini, com disponibilidade geral prevista para o início de junho de 2025.
Google Lança Gemini 2.5 Flash com Capacidades Avançadas de Raciocínio

O Google lançou uma versão de prévia do Gemini 2.5 Flash, a mais recente iteração de seu modelo de IA eficiente, projetado para equilibrar desempenho, velocidade e custo-benefício.

A partir da base do Gemini 2.0 Flash, o novo modelo 2.5 Flash oferece uma grande evolução nas capacidades de raciocínio, mantendo sua reputação de eficiência. O Google o descreve como "uma grande evolução em capacidades de raciocínio, ainda priorizando velocidade e custo".

O grande destaque do Gemini 2.5 Flash é seu sistema de raciocínio híbrido. É o "primeiro modelo de raciocínio totalmente híbrido do Google, permitindo que desenvolvedores ativem ou desativem o pensamento e definam orçamentos de raciocínio para otimizar o equilíbrio entre qualidade, custo e latência". Essa abordagem inovadora dá aos desenvolvedores um controle sem precedentes sobre como o modelo processa tarefas complexas.

Na prática, isso significa que os desenvolvedores podem especificar um "orçamento de raciocínio" que controla quanto raciocínio o modelo realiza. Eles podem ajustar "o número de tokens que o modelo pode gerar enquanto pensa" de 0 a 24.576 tokens usando um controle deslizante no Google AI Studio e Vertex AI, ou por meio de um parâmetro na API. Quando o orçamento de raciocínio é definido como zero, o modelo iguala o custo e a latência do Gemini 2.0 Flash.

A precificação reflete essa flexibilidade: tokens de entrada custam 15 centavos por milhão e tokens de saída, 60 centavos por milhão sem raciocínio. Com as capacidades de pensamento ativadas, o custo sobe para US$ 3,50 por milhão de tokens.

Testes de benchmark mostram resultados impressionantes. O Gemini 2.5 Flash "tem ótimo desempenho em Hard Prompts no LMArena, ficando atrás apenas do 2.5 Pro" e "apresenta métricas comparáveis a outros modelos líderes por uma fração do custo e do tamanho", continuando "a liderar como o modelo com a melhor relação custo-benefício".

O Google descreve o 2.5 Flash como seu "modelo de trabalho mais eficiente, projetado para velocidade e baixo custo", destacando que "melhorou em benchmarks-chave de raciocínio, multimodalidade, código e contexto longo, enquanto ficou ainda mais eficiente, usando de 20 a 30% menos tokens" nas avaliações.

O novo modelo está disponível atualmente em modo de prévia por múltiplos canais. Está sendo disponibilizado "no Google AI Studio (desenvolvedores), Vertex AI (empresas) e no app Gemini (para todos)". Segundo os anúncios do Google na I/O 2025, a versão atualizada estará "disponível de forma geral no Google AI Studio para desenvolvedores e no Vertex AI para empresas no início de junho", com o Gemini 2.5 Pro chegando "em breve depois".

À medida que o Google continua a expandir suas capacidades de IA, o Gemini 2.5 Flash representa um avanço significativo em tornar o raciocínio avançado mais acessível e econômico para desenvolvedores e usuários.

Source:

Latest News