menu
close

Google Apresenta Gemini 2.5 Flash-Lite Ultra-Eficiente para IA Sensível ao Custo

A 15 de julho de 2025, a Google expandiu a família Gemini 2.5 com o lançamento oficial do Flash-Lite, o modelo mais eficiente em termos de custo e o mais rápido da série 2.5. Este lançamento coincide com a disponibilização geral dos modelos Gemini 2.5 Flash e Pro para todos os utilizadores. O Flash-Lite foi concebido para oferecer desempenho superior em tarefas de alto volume, mantendo a menor latência e custo da gama Gemini 2.5.
Google Apresenta Gemini 2.5 Flash-Lite Ultra-Eficiente para IA Sensível ao Custo

A Google lançou oficialmente o Gemini 2.5 Flash-Lite, marcando um avanço significativo na acessibilidade e eficiência da inteligência artificial para programadores e empresas.

O novo modelo, descrito como o "mais eficiente em termos de custo e o mais rápido da série 2.5" da Google, está optimizado para operações de alto volume e sensíveis à latência. O Flash-Lite chega ao mercado com a menor latência e custo da família de modelos 2.5, sendo uma atualização económica face aos modelos Flash 1.5 e 2.0 anteriores. Apresenta um desempenho superior na maioria das avaliações, com menor tempo até ao primeiro token e maior número de tokens por segundo no deciframento, tornando-o ideal para tarefas de alto débito como classificação ou sumarização em larga escala.

Enquanto modelo de raciocínio, o Flash-Lite permite controlo dinâmico do orçamento de processamento através de um parâmetro na API. Ao contrário de outros modelos Gemini 2.5, onde o raciocínio está ativado por defeito, o Flash-Lite optimiza o custo e a velocidade mantendo o raciocínio desligado, a menos que seja explicitamente ativado. Apesar desta optimização, suporta todas as ferramentas nativas, incluindo fundamentação com Pesquisa Google, execução de código, contexto de URL e chamadas de funções.

Os testes de desempenho mostram que o Flash-Lite é 1,5 vezes mais rápido do que o Gemini 2.0 Flash, a um custo inferior, tornando-o especialmente adequado para tarefas como classificação, tradução, encaminhamento inteligente e outras operações de grande escala sensíveis ao custo. Enquanto outros modelos podem recorrer por defeito a ferramentas de raciocínio mais poderosas (e dispendiosas) para responder a perguntas, o Flash-Lite dá aos programadores controlo sobre este processo. Os utilizadores podem ativar ou desativar a capacidade de raciocínio conforme as suas necessidades específicas e, apesar da sua eficiência de custos, o Flash-Lite não está limitado nas suas capacidades.

A pré-visualização do Gemini 2.5 Flash-Lite já está disponível no Google AI Studio e no Vertex AI, juntamente com as versões estáveis do 2.5 Flash e Pro. Tanto o 2.5 Flash como o Pro também estão acessíveis na aplicação Gemini, e a Google disponibilizou versões personalizadas do 2.5 Flash-Lite e Flash na Pesquisa.

Esta expansão estratégica da família de modelos Gemini representa o compromisso da Google em democratizar a IA, oferecendo opções que equilibram desempenho, custo e velocidade para diferentes casos de utilização, desde tarefas complexas de raciocínio até ao processamento de dados em grande volume.

Source:

Latest News