menu
close

Google Apresenta Gemini 2.5 Flash com Capacidades Avançadas de Raciocínio

A Google lançou o Gemini 2.5 Flash em modo de pré-visualização, trazendo melhorias significativas ao seu modelo de IA rápido e económico. Esta nova versão introduz capacidades de raciocínio híbrido que permitem aos programadores controlar o processo de pensamento do modelo, mantendo a velocidade e eficiência. A pré-visualização já está disponível no Google AI Studio, Vertex AI e na aplicação Gemini, estando o lançamento geral previsto para o início de junho de 2025.
Google Apresenta Gemini 2.5 Flash com Capacidades Avançadas de Raciocínio

A Google lançou uma versão de pré-visualização do Gemini 2.5 Flash, a mais recente iteração do seu modelo de IA eficiente, concebido para equilibrar desempenho, velocidade e rentabilidade.

Baseando-se na fundação do Gemini 2.0 Flash, o novo modelo 2.5 Flash oferece uma atualização significativa nas capacidades de raciocínio, mantendo a sua reputação de eficiência. A Google descreve-o como "uma grande evolução nas capacidades de raciocínio, continuando a dar prioridade à velocidade e ao custo."

A característica de destaque do Gemini 2.5 Flash é o seu sistema de raciocínio híbrido. É o "primeiro modelo de raciocínio totalmente híbrido da Google, permitindo aos programadores ativar ou desativar o pensamento e definir orçamentos de pensamento para otimizar o equilíbrio entre qualidade, custo e latência." Esta abordagem inovadora proporciona aos programadores um controlo sem precedentes sobre a forma como o modelo processa tarefas complexas.

Na prática, isto significa que os programadores podem especificar um "orçamento de pensamento" que controla o grau de raciocínio do modelo. Podem ajustar "o número de tokens que o modelo pode gerar enquanto pensa" de 0 a 24.576 tokens, utilizando um controlo deslizante no Google AI Studio e Vertex AI, ou através de um parâmetro na API. Quando o orçamento de pensamento é definido para zero, o modelo iguala o custo e a latência do Gemini 2.0 Flash.

A estrutura de preços reflete esta flexibilidade, com tokens de entrada a custar 15 cêntimos por milhão e tokens de saída 60 cêntimos por milhão sem raciocínio. Com as capacidades de pensamento ativadas, o custo aumenta para 3,50 dólares por milhão de tokens.

Os testes de benchmark mostram resultados impressionantes. O Gemini 2.5 Flash "apresenta um desempenho sólido em Hard Prompts no LMArena, ficando apenas atrás do 2.5 Pro" e "tem métricas comparáveis a outros modelos líderes por uma fração do custo e do tamanho", continuando "a liderar como o modelo com a melhor relação qualidade-preço."

A Google descreve o 2.5 Flash como o seu "modelo de trabalho mais eficiente, concebido para velocidade e baixo custo", salientando que "melhorou nos principais benchmarks de raciocínio, multimodalidade, código e contexto longo, tornando-se ainda mais eficiente, utilizando menos 20-30% de tokens" nas avaliações.

O novo modelo está atualmente disponível em modo de pré-visualização através de vários canais. Está a ser lançado "no Google AI Studio (programadores), Vertex AI (empresas) e na aplicação Gemini (todos os utilizadores)." Segundo os anúncios da Google no I/O 2025, a versão atualizada estará "disponível de forma geral no Google AI Studio para programadores e no Vertex AI para empresas no início de junho", seguindo-se o Gemini 2.5 Pro "pouco depois."

À medida que a Google continua a expandir as suas capacidades de IA, o Gemini 2.5 Flash representa um avanço significativo na disponibilização de raciocínio avançado de forma mais acessível e económica para programadores e utilizadores.

Source:

Latest News