Em um marco importante para a inteligência artificial, a OpenAI anunciou que seu mais recente modelo experimental de raciocínio atingiu desempenho de nível medalha de ouro na Olimpíada Internacional de Matemática (IMO) de 2025, considerada a competição de matemática mais prestigiada do mundo.
O modelo solucionou com sucesso cinco dos seis problemas da IMO 2025, obtendo 35 dos 42 pontos possíveis — equivalente a uma performance de medalha de ouro. O que torna essa conquista especialmente notável é o fato de que a IA operou sob as mesmas condições rigorosas dos participantes humanos: duas sessões de prova de 4,5 horas, sem acesso a ferramentas, internet ou assistência externa.
"Isso representa um novo patamar de pensamento criativo sustentado em comparação com referências anteriores", afirmou Alexander Wei, pesquisador da OpenAI que anunciou o avanço. Wei destacou que o horizonte temporal do raciocínio evoluiu de problemas matemáticos simples, que os melhores humanos resolvem em cerca de 0,1 minuto, para questões da IMO que exigem aproximadamente 100 minutos de esforço concentrado.
Diferentemente de sistemas anteriores desenvolvidos especificamente para competições matemáticas, o modelo da OpenAI é um modelo de linguagem de raciocínio de uso geral, que incorpora novas técnicas experimentais de aprendizado por reforço e escalonamento computacional durante a resolução dos testes. Três ex-medalhistas da IMO avaliaram de forma independente as soluções apresentadas pelo modelo, com as notas finalizadas após consenso unânime.
Essa conquista se destaca especialmente em comparação com outros modelos líderes de IA. Em uma avaliação recente da MathArena.ai, concorrentes como Gemini 2.5 Pro, Grok-4 e o modelo o3 anterior da OpenAI não conseguiram sequer atingir o patamar de medalha de bronze nos mesmos problemas.
O momento desse avanço coincide com o lançamento iminente do GPT-5 pela OpenAI, previsto para os próximos meses. Segundo diversas fontes, o GPT-5 irá unificar os vários modelos especializados da OpenAI — incluindo as capacidades de raciocínio demonstradas nesta conquista da IMO — em um único sistema com um roteador inteligente que seleciona automaticamente a abordagem mais adequada para cada tarefa.
"O LLM medalhista de ouro da IMO é um modelo de pesquisa experimental. Não planejamos lançar nada com esse nível de capacidade matemática por vários meses", esclareceu Wei, sugerindo que essas capacidades avançadas de raciocínio poderão ser incorporadas em futuras versões públicas.