O Google anunciou um avanço significativo para seu principal modelo de IA com a introdução do modo Deep Think para o Gemini 2.5 Pro, representando um grande salto nas capacidades de raciocínio da inteligência artificial.
O Deep Think utiliza pesquisas de ponta em técnicas de pensamento paralelo, permitindo que o modelo explore e avalie múltiplas soluções potenciais simultaneamente antes de fornecer uma resposta. Essa abordagem reflete a forma como especialistas humanos enfrentam problemas complexos, considerando diferentes ângulos e hipóteses.
"Ele utiliza nossas pesquisas mais avançadas em raciocínio – incluindo técnicas de pensamento paralelo – resultando em um desempenho incrível", explicou Demis Hassabis, CEO do Google DeepMind, durante o anúncio no Google I/O 2025.
O novo modo apresentou resultados excepcionais em benchmarks desafiadores. Obteve uma pontuação impressionante na Olimpíada Matemática dos Estados Unidos de 2025 (USAMO), amplamente considerada um dos benchmarks matemáticos mais difíceis disponíveis. O Deep Think também lidera no LiveCodeBench, um benchmark exigente para programação em nível de competição, e alcançou 84% no MMMU, que testa o raciocínio multimodal em diversas tarefas.
Além do Deep Think, o Google aprimorou significativamente a segurança em toda a família Gemini 2.5. A empresa implementou proteções avançadas contra ataques indiretos de injeção de prompt – quando instruções maliciosas são inseridas em dados recuperados pelo modelo de IA. Segundo o Google, a nova abordagem de segurança aumentou substancialmente a taxa de proteção do Gemini contra esses ataques durante o uso de ferramentas, tornando a série 2.5 a família de modelos mais segura do Google até o momento.
O Google está adotando uma abordagem cautelosa para o lançamento do Deep Think. "Como estamos definindo a fronteira com o 2.5 Pro DeepThink, estamos dedicando mais tempo para realizar avaliações de segurança de fronteira e obter mais contribuições de especialistas em segurança", afirmou a empresa. Inicialmente, o Deep Think estará disponível apenas para testadores confiáveis via API do Gemini, a fim de coletar feedback antes de uma liberação mais ampla.
A empresa também anunciou melhorias no Gemini 2.5 Flash, seu modelo mais eficiente, projetado para velocidade e baixo custo. A versão atualizada utiliza 20-30% menos tokens, ao mesmo tempo em que oferece desempenho aprimorado em benchmarks de raciocínio, multimodalidade, código e contexto longo.