O Google lançou oficialmente o Gemini 2.5 Flash para todos os usuários, marcando um avanço significativo tanto nas capacidades de IA quanto em recursos de segurança.
A nova versão, já disponível no aplicativo Gemini, traz melhorias importantes em diversas áreas. Segundo Demis Hassabis, chefe do Google DeepMind, o Gemini 2.5 Flash é "melhor em praticamente todos os aspectos", apresentando desempenho aprimorado em raciocínio, multimodalidade, código e benchmarks de contexto longo. Talvez o mais impressionante seja o fato de alcançar esses ganhos tornando-se 22% mais eficiente, utilizando menos tokens para gerar respostas semelhantes.
A segurança foi um dos principais focos nesta atualização. O Google implementou proteções avançadas que aumentam significativamente a proteção do Gemini contra ataques indiretos de injeção de prompts durante o uso de ferramentas. Esses ataques ocorrem quando instruções maliciosas são inseridas em dados que o modelo de IA acessa. Por meio de uma combinação de reforço do modelo, verificações de entrada/saída e barreiras em nível de sistema, o Google tornou o Gemini 2.5 sua família de modelos mais segura até agora.
Desenvolvedores terão acesso à versão atualizada no Google AI Studio e empresas poderão utilizá-la via Vertex AI no início de junho, com o Gemini 2.5 Pro sendo lançado logo em seguida. A atualização inclui novos recursos voltados para desenvolvedores, como "resumos de pensamento", que organizam o processo de raciocínio do modelo em um formato estruturado com títulos e detalhes-chave, facilitando a compreensão e depuração das interações.
O Gemini 2.5 Pro será aprimorado com o Deep Think, um modo experimental de raciocínio projetado especificamente para tarefas matemáticas e de programação altamente complexas. Esse recurso permite que o modelo considere múltiplas hipóteses antes de responder, alcançando pontuações impressionantes em benchmarks difíceis como o teste de matemática USAMO 2025 e o LiveCodeBench para programação competitiva.
A família Gemini 2.5 também traz novas capacidades de áudio, incluindo conversão de texto em fala nativa com suporte para múltiplos falantes em 24 idiomas. Os usuários podem personalizar o tom, sotaque e estilo de fala da IA, sendo que o modelo é capaz de detectar emoções na voz do usuário e responder de forma apropriada.
Com essas melhorias, o Google continua posicionando o Gemini como uma plataforma de IA líder tanto para consumidores quanto para empresas, equilibrando capacidades avançadas com medidas de segurança mais robustas.