menu
close

Google Expande a Família Gemini 2.5 com o Ultra-Eficiente Flash-Lite

A Google expandiu a sua família Gemini 2.5 ao disponibilizar de forma geral os modelos Gemini 2.5 Flash e Pro, e ao lançar o 2.5 Flash-Lite em pré-visualização – o seu modelo 2.5 mais rápido e económico até à data. O Flash-Lite é um modelo de raciocínio optimizado para custo e velocidade, com o "pensamento" desativado por defeito, oferecendo uma opção ainda mais acessível para casos de uso sensíveis à latência que requerem menor inteligência do modelo. Entretanto, o Gemini 2.5 Pro tornou-se o modelo líder mundial nas tabelas WebDev Arena e LMArena, demonstrando o contínuo avanço da Google em IA.
Google Expande a Família Gemini 2.5 com o Ultra-Eficiente Flash-Lite

A Google anunciou que os modelos Gemini 2.5 Flash e 2.5 Pro estão agora estáveis e disponíveis de forma geral, proporcionando às organizações a fiabilidade e escalabilidade necessárias para implementar capacidades avançadas de IA em aplicações críticas. Em simultâneo, a empresa apresentou o Gemini 2.5 Flash-Lite em pré-visualização, descrito como o seu modelo 2.5 mais eficiente em termos de custo e o mais rápido até agora.

O Gemini 2.5 Flash-Lite é um modelo de raciocínio que permite o controlo dinâmico do orçamento de pensamento através de um parâmetro na API. Ao contrário de outros modelos da família 2.5, o Flash-Lite está optimizado para custo e velocidade, com o "pensamento" desativado por defeito. Apesar destas optimizações, suporta todas as ferramentas nativas, incluindo Grounding com Pesquisa Google, Execução de Código e Contexto de URL, para além de chamadas de função.

O Flash-Lite oferece um desempenho superior ao modelo Flash-Lite anterior e é 1,5 vezes mais rápido do que o 2.0 Flash, a um custo inferior. Foi especificamente concebido para tarefas de grande volume e sensíveis à latência, como tradução, classificação, encaminhamento inteligente e outras operações de grande escala e sensíveis ao custo. O modelo apresenta um desempenho significativamente superior ao 2.0 Flash-Lite em benchmarks de programação, matemática, ciência, raciocínio e multimodalidade, tornando-o ideal para tarefas de elevado volume.

Tal como outros modelos da família Gemini 2.5, o Flash-Lite inclui funcionalidades úteis, como a possibilidade de ativar o pensamento com diferentes orçamentos, ligação a ferramentas como Grounding com Pesquisa Google e execução de código, entrada multimodal e um contexto de até 1 milhão de tokens. Para garantir respostas atuais e factuais, o Flash-Lite pode utilizar a Pesquisa Google como ferramenta integrada, decidindo de forma inteligente quando recorrer à Pesquisa para complementar o seu conhecimento.

Para além da introdução do Flash-Lite, a Google anunciou que o Gemini 2.5 Pro se tornou o modelo líder mundial nas tabelas WebDev Arena e LMArena. Com uma pontuação ELO de 1415 na tabela de programação WebDev Arena, lidera todas as tabelas da LMArena, que avalia preferências humanas em múltiplas dimensões.

Adicionalmente, a Google integrou o LearnLM diretamente no Gemini 2.5, tornando-o o modelo líder mundial para aprendizagem. Segundo o relatório mais recente, o Gemini 2.5 Pro superou os concorrentes em todas as categorias de princípios de ciência da aprendizagem, sendo preferido por educadores e especialistas em pedagogia em vários cenários de aprendizagem.

O Gemini 2.5 Flash-Lite está agora disponível em pré-visualização no Google AI Studio e Vertex AI, juntamente com as versões estáveis do 2.5 Flash e Pro. Os programadores podem aceder ao modelo (gemini-2.5-flash-lite-preview-06-17) através do Google Gen AI SDK, que oferece uma interface unificada para a família de modelos Gemini 2.5, tanto pela Gemini Developer API como pela Vertex AI Gemini API.

Source:

Latest News