O Google está se preparando para uma expansão significativa de suas capacidades de IA com o lançamento geral do Gemini 2.5 Pro previsto para junho de 2025.
De acordo com anúncios recentes do Google DeepMind, o Gemini 2.5 Flash já está disponível para todos no aplicativo Gemini, com planos de disponibilizá-lo de forma geral no Google AI Studio para desenvolvedores e no Vertex AI para empresas no início de junho. A versão mais poderosa, Gemini 2.5 Pro, será lançada logo em seguida.
O grande destaque do modelo 2.5 Pro é o Deep Think, um modo experimental de raciocínio aprimorado que permite ao modelo considerar múltiplas hipóteses antes de responder. Essa capacidade foi desenvolvida especialmente para tarefas altamente complexas de matemática e programação, com o Google relatando resultados impressionantes em benchmarks difíceis como a Olimpíada de Matemática dos EUA de 2025 e o LiveCodeBench, um benchmark de programação em nível de competição.
"Ao explorar as fronteiras das capacidades de raciocínio do Gemini, começamos a testar um modo aprimorado chamado Deep Think, que utiliza novas técnicas de pesquisa e permite ao modelo considerar múltiplas hipóteses antes de responder", afirmou o Google em uma postagem recente no blog.
A segurança tem sido um foco central para a família Gemini 2.5. O Google implementou proteções de segurança avançadas que aumentaram substancialmente a proteção do Gemini contra ataques indiretos de injeção de prompt durante o uso de ferramentas. Esses ataques ocorrem quando instruções maliciosas são inseridas em dados que o modelo de IA recupera. Por meio de testes automatizados (red teaming) e reforço do modelo, o Google reduziu significativamente a taxa de sucesso desses ataques, tornando a família 2.5 a mais segura até agora.
Além das melhorias em segurança, o Google está trazendo as capacidades de uso de computador do Project Mariner para a API do Gemini e para o Vertex AI. Empresas como Automation Anywhere, UiPath, Browserbase e outras já estão explorando o potencial dessas ferramentas para automação e aprimoramento de fluxos de trabalho.
Outros recursos que chegarão tanto ao 2.5 Pro quanto ao 2.5 Flash incluem resumos de raciocínio, que organizam o processo de pensamento do modelo em um formato claro, e capacidades nativas de áudio com suporte a múltiplos falantes em mais de 24 idiomas.
À medida que o Google continua a competir no cenário cada vez mais acirrado da IA, esses avanços no Gemini 2.5 Pro representam progressos significativos em raciocínio, segurança e funcionalidades multimodais.