O Google apresentou uma melhoria significativa em seus principais modelos de IA com a adição de resumos de raciocínio tanto para os modelos Gemini 2.5 Pro quanto Flash, disponíveis por meio da API Gemini e do Vertex AI.
Os resumos de raciocínio transformam o processo bruto de pensamento do modelo em um formato claro e estruturado, com títulos, detalhes-chave e informações sobre as ações do modelo, como o uso de ferramentas. Esse recurso representa um grande avanço na transparência e na capacidade de depuração do raciocínio da IA.
"Esperamos que, com um formato mais estruturado e simplificado do processo de pensamento do modelo, desenvolvedores e usuários achem as interações com os modelos Gemini mais fáceis de entender e depurar", afirmou o Google em seu anúncio durante o Google I/O 2025.
A funcionalidade de resumos de raciocínio chega junto com outras melhorias para a família Gemini 2.5, incluindo a extensão dos orçamentos de raciocínio para o Gemini 2.5 Pro. Esse recurso, antes disponível apenas no Flash, permite que desenvolvedores controlem o número de tokens que o modelo utiliza para pensar antes de responder, ou até mesmo desativem completamente a capacidade de raciocínio, proporcionando maior controle sobre custos, qualidade e latência.
Para usuários corporativos, os resumos de raciocínio representam um avanço em confiança e direcionamento. Organizações que avaliam resultados de IA para tarefas críticas — como análise de implicações políticas, lógica de código ou resumo de pesquisas complexas — agora podem visualizar como o modelo chegou às suas conclusões, tornando a tomada de decisão da IA mais transparente para as partes interessadas.
O Google anunciou que o Gemini 2.5 Flash já está disponível em prévia no Google AI Studio para desenvolvedores, no Vertex AI para empresas e no aplicativo Gemini para todos os usuários. A versão atualizada estará disponível para produção no início de junho, com o Gemini 2.5 Pro sendo lançado logo em seguida.