En un hito significativo para la inteligencia artificial, tanto OpenAI como Google DeepMind han demostrado un razonamiento matemático a nivel de medalla de oro en la Olimpiada Internacional de Matemáticas (IMO) 2025, la competencia más prestigiosa del mundo para jóvenes matemáticos.
Los modelos de IA de ambas compañías lograron puntuaciones idénticas de 35 sobre un máximo de 42 puntos, resolviendo perfectamente cinco de los seis problemas. Este desempeño igualó el umbral para la medalla de oro en la competencia de este año, donde solo alrededor del 11% de los 630 concursantes humanos (aproximadamente 67 estudiantes) recibieron medallas de oro.
La versión avanzada de Gemini con Deep Think de Google DeepMind fue calificada y certificada oficialmente por los coordinadores de la IMO, y el presidente de la IMO, Gregor Dolinar, señaló que sus soluciones fueron "sorprendentes en muchos aspectos" y "claras, precisas y en su mayoría fáciles de seguir". Esto representa un avance significativo respecto al año pasado, cuando DeepMind obtuvo la medalla de plata utilizando sistemas especializados.
OpenAI evaluó su modelo experimental de razonamiento en los mismos problemas bajo condiciones idénticas a las de la competencia: dos sesiones de examen de 4.5 horas sin acceso a internet ni herramientas. Aunque OpenAI no formó parte del proceso oficial de evaluación de la IMO, la empresa hizo que sus soluciones fueran calificadas de manera independiente por tres exmedallistas de la IMO.
El momento de los anuncios generó cierta tensión entre las compañías. OpenAI publicó sus resultados el 19 de julio, mientras que Google DeepMind esperó hasta el 21 de julio, respetando la solicitud del Consejo de la IMO de compartir los resultados después de la verificación oficial y el reconocimiento a los estudiantes.
Junehyuk Jung, profesor de matemáticas en la Universidad de Brown e investigador visitante en Google DeepMind, considera que este logro sugiere que la IA está a menos de un año de ayudar a los matemáticos a abordar problemas de investigación aún no resueltos en la frontera de las matemáticas. "Creo que el momento en que podamos resolver problemas de razonamiento difíciles en lenguaje natural permitirá el potencial de colaboración entre la IA y los matemáticos", dijo Jung a Reuters.
Aunque es impresionante, algunos expertos advierten que los problemas de la IMO, aunque difíciles, son conceptualmente más sencillos que las matemáticas de investigación de frontera. El logro demuestra las crecientes capacidades de razonamiento de la IA, pero no necesariamente indica que esté lista para todos los aspectos de la investigación matemática.