Google Apresenta Gemini 2.5 Flash-Lite Ultra-Eficiente para IA Sensível ao Custo

A 15 de julho de 2025, a Google expandiu a família Gemini 2.5 com o lançamento oficial do Flash-Lite, o modelo mais eficiente em termos de custo e o mais rápido da série 2.5. Este lançamento coincide com a disponibilização geral dos modelos Gemini 2.5 Flash e Pro para todos os utilizadores. O Flash-Lite foi concebido para oferecer desempenho superior em tarefas de alto volume, mantendo a menor latência e custo da gama Gemini 2.5.

A Google lançou oficialmente o Gemini 2.5 Flash-Lite, marcando um avanço significativo na acessibilidade e eficiência da inteligência artificial para programadores e empresas.

O novo modelo, descrito como o "mais eficiente em termos de custo e o mais rápido da série 2.5" da Google, está optimizado para operações de alto volume e sensíveis à latência. O Flash-Lite chega ao mercado com a menor latência e custo da família de modelos 2.5, sendo uma atualização económica face aos modelos Flash 1.5 e 2.0 anteriores. Apresenta um desempenho superior na maioria das avaliações, com menor tempo até ao primeiro token e maior número de tokens por segundo no deciframento, tornando-o ideal para tarefas de alto débito como classificação ou sumarização em larga escala.

Enquanto modelo de raciocínio, o Flash-Lite permite controlo dinâmico do orçamento de processamento através de um parâmetro na API. Ao contrário de outros modelos Gemini 2.5, onde o raciocínio está ativado por defeito, o Flash-Lite optimiza o custo e a velocidade mantendo o raciocínio desligado, a menos que seja explicitamente ativado. Apesar desta optimização, suporta todas as ferramentas nativas, incluindo fundamentação com Pesquisa Google, execução de código, contexto de URL e chamadas de funções.

Os testes de desempenho mostram que o Flash-Lite é 1,5 vezes mais rápido do que o Gemini 2.0 Flash, a um custo inferior, tornando-o especialmente adequado para tarefas como classificação, tradução, encaminhamento inteligente e outras operações de grande escala sensíveis ao custo. Enquanto outros modelos podem recorrer por defeito a ferramentas de raciocínio mais poderosas (e dispendiosas) para responder a perguntas, o Flash-Lite dá aos programadores controlo sobre este processo. Os utilizadores podem ativar ou desativar a capacidade de raciocínio conforme as suas necessidades específicas e, apesar da sua eficiência de custos, o Flash-Lite não está limitado nas suas capacidades.

A pré-visualização do Gemini 2.5 Flash-Lite já está disponível no Google AI Studio e no Vertex AI, juntamente com as versões estáveis do 2.5 Flash e Pro. Tanto o 2.5 Flash como o Pro também estão acessíveis na aplicação Gemini, e a Google disponibilizou versões personalizadas do 2.5 Flash-Lite e Flash na Pesquisa.

Esta expansão estratégica da família de modelos Gemini representa o compromisso da Google em democratizar a IA, oferecendo opções que equilibram desempenho, custo e velocidade para diferentes casos de utilização, desde tarefas complexas de raciocínio até ao processamento de dados em grande volume.

Source:

Google Apresenta Gemini 2.5 Flash-Lite Ultra-Eficiente para IA Sensível ao Custo

Latest News

Google Lança Gemini CLI: Assistente de IA para Terminais de Programadores

Google Lança Imagen 4 com Renderização de Texto Revolucionária

IA da Google Revoluciona os Cuidados Oncológicos com Ferramentas Inovadoras de Deteção

IA no Dispositivo da Google Traz Inteligência Autónoma aos Robôs

Empresas Carecem de Competências Humanas Cruciais para o Sucesso na Era da IA

VentureBeat Revela Mudança Significativa no Mercado de IA em Análise para 2025

GPT-5 da OpenAI vai Unificar Capacidades de IA num Único Modelo Potente

Aposta de 14,8 mil milhões de dólares da Meta em IA: Desespero ou Génio Estratégico?

Gigantes Tecnológicas Apostam na Energia Nuclear para Suprir as Necessidades Energéticas da IA

Dailymotion Revela Revolução na Plataforma de Vídeo Potenciada por IA

Google Apresenta Gemini 2.5 Flash-Lite Ultra-Eficiente para IA Sensível ao Custo

Related Articles

IA no Dispositivo da Google Traz Inteligência Autónoma aos Robôs

Google Lança Imagen 4 com Renderização de Texto Revolucionária

Google Lança Gemini CLI: Assistente de IA para Terminais de Programadores

Kimi K2 da Moonshot AI, com um bilião de parâmetros, desafia os gigantes da IA

Google Expande o Gemini Live com Integrações de Apps Mais Profundas

Latest News

Google Lança Gemini CLI: Assistente de IA para Terminais de Programadores

Google Lança Imagen 4 com Renderização de Texto Revolucionária

IA da Google Revoluciona os Cuidados Oncológicos com Ferramentas Inovadoras de Deteção

IA no Dispositivo da Google Traz Inteligência Autónoma aos Robôs

Empresas Carecem de Competências Humanas Cruciais para o Sucesso na Era da IA

VentureBeat Revela Mudança Significativa no Mercado de IA em Análise para 2025

GPT-5 da OpenAI vai Unificar Capacidades de IA num Único Modelo Potente

Aposta de 14,8 mil milhões de dólares da Meta em IA: Desespero ou Génio Estratégico?

Gigantes Tecnológicas Apostam na Energia Nuclear para Suprir as Necessidades Energéticas da IA

Dailymotion Revela Revolução na Plataforma de Vídeo Potenciada por IA