Google Lança Gemini 2.5 Flash-Lite Ultra-Eficiente para IA de Baixo Custo

Em 15 de julho de 2025, o Google ampliou a família Gemini 2.5 ao lançar oficialmente o Flash-Lite, seu modelo mais econômico e rápido da série 2.5. O lançamento coincide com a disponibilidade geral dos modelos Gemini 2.5 Flash e Pro para todos os usuários. O Flash-Lite foi projetado para oferecer desempenho superior em tarefas de alto volume, mantendo a menor latência e custo da linha Gemini 2.5.

O Google lançou oficialmente o Gemini 2.5 Flash-Lite, marcando um avanço significativo para tornar a IA poderosa mais acessível e eficiente tanto para desenvolvedores quanto para empresas.

O novo modelo, descrito como o "mais econômico e rápido da série 2.5" do Google, foi otimizado para operações de alto volume e sensíveis à latência. O Flash-Lite chega ao mercado com a menor latência e custo da família de modelos 2.5, sendo uma atualização econômica em relação aos modelos Flash 1.5 e 2.0 anteriores. Ele oferece melhor desempenho na maioria das avaliações, com menor tempo para o primeiro token e maior taxa de decodificação de tokens por segundo, tornando-o ideal para tarefas de alto rendimento como classificação ou sumarização em larga escala.

Como modelo de raciocínio, o Flash-Lite permite o controle dinâmico do orçamento de processamento por meio de um parâmetro na API. Diferentemente dos outros modelos Gemini 2.5, nos quais o raciocínio está ativado por padrão, o Flash-Lite otimiza custo e velocidade mantendo o raciocínio desativado, a menos que seja explicitamente habilitado. Apesar dessa otimização, ele ainda suporta todas as ferramentas nativas, incluindo fundamentação com Google Search, execução de código, contexto de URL e chamadas de função.

Testes de desempenho mostram que o Flash-Lite é 1,5 vez mais rápido que o Gemini 2.0 Flash, com custo inferior, tornando-o especialmente adequado para tarefas como classificação, tradução, roteamento inteligente e outras operações de grande escala e sensíveis a custos. Enquanto outros modelos podem recorrer por padrão a ferramentas de raciocínio mais poderosas (e caras) para responder perguntas, o Flash-Lite dá aos desenvolvedores o controle sobre esse processo. Os usuários podem ativar ou desativar a capacidade de raciocínio conforme suas necessidades específicas e, apesar da eficiência de custos, o Flash-Lite não é limitado em suas capacidades.

A prévia do Gemini 2.5 Flash-Lite já está disponível no Google AI Studio e no Vertex AI, juntamente com as versões estáveis do 2.5 Flash e Pro. Tanto o 2.5 Flash quanto o Pro também podem ser acessados no aplicativo Gemini, e o Google trouxe versões personalizadas do 2.5 Flash-Lite e Flash para o Search.

Essa expansão estratégica da família de modelos Gemini representa o compromisso do Google em democratizar a IA, oferecendo opções que equilibram desempenho, custo e velocidade para diferentes casos de uso, desde tarefas complexas de raciocínio até processamento de dados em grande escala.

Source:

Google Lança Gemini 2.5 Flash-Lite Ultra-Eficiente para IA de Baixo Custo

Latest News

Google Lança Gemini CLI: Assistente de IA para Terminais de Desenvolvedores

Google Lança Imagen 4 com Renderização de Texto Revolucionária

IA do Google Revoluciona o Combate ao Câncer com Ferramentas Inovadoras de Detecção

IA Local da Google Traz Inteligência Autônoma para Robôs

Empresas Carecem de Habilidades Humanas Críticas para o Sucesso na Era da IA

VentureBeat Revela Grande Mudança no Mercado de IA em Análise de 2025

GPT-5 da OpenAI vai Unificar Capacidades de IA em um Único Modelo Poderoso

Aposta de US$ 14,8 bilhões da Meta em IA: Desespero ou Gênio Estratégico?

Gigantes da Tecnologia Apostam na Energia Nuclear para Suprir Demandas Energéticas da IA

Dailymotion revela revolução em plataforma de vídeo impulsionada por IA

Google Lança Gemini 2.5 Flash-Lite Ultra-Eficiente para IA de Baixo Custo

Related Articles

IA Local da Google Traz Inteligência Autônoma para Robôs

Google Lança Imagen 4 com Renderização de Texto Revolucionária

Google Lança Gemini CLI: Assistente de IA para Terminais de Desenvolvedores

Kimi K2 da Moonshot AI, com 1 trilhão de parâmetros, desafia gigantes da IA

Google Expande o Gemini Live com Integrações Mais Profundas de Apps

Latest News

Google Lança Gemini CLI: Assistente de IA para Terminais de Desenvolvedores

Google Lança Imagen 4 com Renderização de Texto Revolucionária

IA do Google Revoluciona o Combate ao Câncer com Ferramentas Inovadoras de Detecção

IA Local da Google Traz Inteligência Autônoma para Robôs

Empresas Carecem de Habilidades Humanas Críticas para o Sucesso na Era da IA

VentureBeat Revela Grande Mudança no Mercado de IA em Análise de 2025

GPT-5 da OpenAI vai Unificar Capacidades de IA em um Único Modelo Poderoso

Aposta de US$ 14,8 bilhões da Meta em IA: Desespero ou Gênio Estratégico?

Gigantes da Tecnologia Apostam na Energia Nuclear para Suprir Demandas Energéticas da IA

Dailymotion revela revolução em plataforma de vídeo impulsionada por IA