Google Lança Gemini 2.5 Flash com Capacidades Avançadas de Raciocínio

O Google lançou o Gemini 2.5 Flash em modo de prévia, trazendo melhorias significativas para seu modelo de IA rápido e econômico. Esta nova versão introduz capacidades de raciocínio híbrido que permitem aos desenvolvedores controlar o processo de pensamento do modelo, mantendo velocidade e eficiência. A prévia já está disponível no Google AI Studio, Vertex AI e no app Gemini, com disponibilidade geral prevista para o início de junho de 2025.

O Google lançou uma versão de prévia do Gemini 2.5 Flash, a mais recente iteração de seu modelo de IA eficiente, projetado para equilibrar desempenho, velocidade e custo-benefício.

A partir da base do Gemini 2.0 Flash, o novo modelo 2.5 Flash oferece uma grande evolução nas capacidades de raciocínio, mantendo sua reputação de eficiência. O Google o descreve como "uma grande evolução em capacidades de raciocínio, ainda priorizando velocidade e custo".

O grande destaque do Gemini 2.5 Flash é seu sistema de raciocínio híbrido. É o "primeiro modelo de raciocínio totalmente híbrido do Google, permitindo que desenvolvedores ativem ou desativem o pensamento e definam orçamentos de raciocínio para otimizar o equilíbrio entre qualidade, custo e latência". Essa abordagem inovadora dá aos desenvolvedores um controle sem precedentes sobre como o modelo processa tarefas complexas.

Na prática, isso significa que os desenvolvedores podem especificar um "orçamento de raciocínio" que controla quanto raciocínio o modelo realiza. Eles podem ajustar "o número de tokens que o modelo pode gerar enquanto pensa" de 0 a 24.576 tokens usando um controle deslizante no Google AI Studio e Vertex AI, ou por meio de um parâmetro na API. Quando o orçamento de raciocínio é definido como zero, o modelo iguala o custo e a latência do Gemini 2.0 Flash.

A precificação reflete essa flexibilidade: tokens de entrada custam 15 centavos por milhão e tokens de saída, 60 centavos por milhão sem raciocínio. Com as capacidades de pensamento ativadas, o custo sobe para US$ 3,50 por milhão de tokens.

Testes de benchmark mostram resultados impressionantes. O Gemini 2.5 Flash "tem ótimo desempenho em Hard Prompts no LMArena, ficando atrás apenas do 2.5 Pro" e "apresenta métricas comparáveis a outros modelos líderes por uma fração do custo e do tamanho", continuando "a liderar como o modelo com a melhor relação custo-benefício".

O Google descreve o 2.5 Flash como seu "modelo de trabalho mais eficiente, projetado para velocidade e baixo custo", destacando que "melhorou em benchmarks-chave de raciocínio, multimodalidade, código e contexto longo, enquanto ficou ainda mais eficiente, usando de 20 a 30% menos tokens" nas avaliações.

O novo modelo está disponível atualmente em modo de prévia por múltiplos canais. Está sendo disponibilizado "no Google AI Studio (desenvolvedores), Vertex AI (empresas) e no app Gemini (para todos)". Segundo os anúncios do Google na I/O 2025, a versão atualizada estará "disponível de forma geral no Google AI Studio para desenvolvedores e no Vertex AI para empresas no início de junho", com o Gemini 2.5 Pro chegando "em breve depois".

À medida que o Google continua a expandir suas capacidades de IA, o Gemini 2.5 Flash representa um avanço significativo em tornar o raciocínio avançado mais acessível e econômico para desenvolvedores e usuários.

Source:

Google Lança Gemini 2.5 Flash com Capacidades Avançadas de Raciocínio

Latest News

Doubao AI da ByteDance Agora Oferece Assistência em Vídeo em Tempo Real

OnePlus Substitui o Alert Slider por Botão Plus com IA

Gigantes de Tecnologia Alemães se Unem para Construir Gigafábrica de IA com Apoio da UE

Promotores dos EUA Investigaram a Builder.ai Antes do Colapso da Startup de IA Avaliada em US$ 1,5 Bi

Fundo de US$ 1,8 trilhão da Noruega torna uso de IA obrigatório para funcionários

OpenTools.ai Lança Hub de Notícias de IA para Profissionais de Tecnologia

Google Expande Controle de Computadores por IA para Desenvolvedores via Gemini

Google Aperfeiçoa Modelos Gemini com Resumos Transparentes de Raciocínio

Google Lança Gemini 2.5 Flash com Capacidades Avançadas de Raciocínio

Related Articles

Doubao AI da ByteDance Agora Oferece Assistência em Vídeo em Tempo Real

OpenTools.ai Lança Hub de Notícias de IA para Profissionais de Tecnologia

Google Expande Controle de Computadores por IA para Desenvolvedores via Gemini

Google Aperfeiçoa Modelos Gemini com Resumos Transparentes de Raciocínio

Google Estende Controles de Custos de IA ao Gemini 2.5 Pro

Latest News

Doubao AI da ByteDance Agora Oferece Assistência em Vídeo em Tempo Real

OnePlus Substitui o Alert Slider por Botão Plus com IA

Gigantes de Tecnologia Alemães se Unem para Construir Gigafábrica de IA com Apoio da UE

Promotores dos EUA Investigaram a Builder.ai Antes do Colapso da Startup de IA Avaliada em US$ 1,5 Bi

Fundo de US$ 1,8 trilhão da Noruega torna uso de IA obrigatório para funcionários

OpenTools.ai Lança Hub de Notícias de IA para Profissionais de Tecnologia

Google Expande Controle de Computadores por IA para Desenvolvedores via Gemini

Google Aperfeiçoa Modelos Gemini com Resumos Transparentes de Raciocínio