A Google anunciou um avanço significativo para o seu principal modelo de IA com a introdução do modo Deep Think para o Gemini 2.5 Pro, representando um grande salto nas capacidades de raciocínio da inteligência artificial.
O Deep Think recorre a investigação de ponta em técnicas de pensamento paralelo, permitindo ao modelo explorar e avaliar múltiplas soluções potenciais em simultâneo antes de apresentar uma resposta. Esta abordagem espelha a forma como especialistas humanos enfrentam problemas complexos, considerando diferentes perspetivas e hipóteses.
"Utiliza a nossa mais recente investigação de ponta em raciocínio – incluindo técnicas de pensamento paralelo – resultando num desempenho incrível", explicou Demis Hassabis, CEO da Google DeepMind, durante o anúncio na Google I/O 2025.
O novo modo demonstrou resultados excecionais em benchmarks exigentes. Alcançou uma pontuação impressionante na Olimpíada Matemática dos Estados Unidos da América de 2025 (USAMO), amplamente considerada um dos benchmarks matemáticos mais difíceis. O Deep Think também lidera no LiveCodeBench, um benchmark desafiante para programação ao nível de competição, e obteve 84% no MMMU, que avalia o raciocínio multimodal em tarefas diversas.
Para além do Deep Think, a Google reforçou significativamente a segurança em toda a família Gemini 2.5. A empresa implementou salvaguardas avançadas contra ataques indiretos de injeção de prompts – onde instruções maliciosas são incorporadas em dados que o modelo de IA recupera. Segundo a Google, a nova abordagem de segurança aumentou substancialmente a taxa de proteção do Gemini contra estes ataques durante a utilização de ferramentas, tornando a série 2.5 a família de modelos mais segura da Google até à data.
A Google está a adotar uma abordagem cautelosa no lançamento do Deep Think. "Como estamos a definir a fronteira com o 2.5 Pro DeepThink, estamos a dedicar mais tempo a avaliações de segurança de fronteira e a recolher contributos adicionais de especialistas em segurança", afirmou a empresa. Inicialmente, o Deep Think estará disponível apenas para testadores de confiança através da API do Gemini, para recolher feedback antes de um lançamento mais alargado.
A empresa anunciou ainda melhorias no Gemini 2.5 Flash, o seu modelo mais eficiente, concebido para velocidade e baixo custo. A versão atualizada utiliza menos 20-30% de tokens, ao mesmo tempo que oferece melhor desempenho em benchmarks de raciocínio, multimodalidade, código e contexto alargado.