La carrera hacia la inteligencia artificial general (AGI) ha alcanzado un momento crucial con el modelo o3 de OpenAI, que demuestra capacidades consideradas imposibles hace tan solo unos meses.
Zach Vorhies, el exempleado denunciante de Google que saltó a la fama tras exponer en 2019 lo que describió como un régimen de censura en Google, se ha convertido en un firme defensor de acelerar, y no frenar, el desarrollo de la IA. En recientes entrevistas, Vorhies ha rechazado de forma tajante la idea de que el progreso de la IA se esté estancando, citando el modelo o3 de OpenAI como prueba definitiva de un avance cada vez más rápido.
El sistema o3 ha logrado lo que muchos expertos consideran un hito, obteniendo un 75,7% en el benchmark ARC-AGI bajo condiciones estándar de computación y alcanzando un 87,5% con mayores recursos computacionales. Este rendimiento supera la puntuación media humana del 80% en estas tareas de razonamiento abstracto, diseñadas específicamente para evaluar capacidades de inteligencia general. François Chollet, creador del ARC Challenge, reconoció que esto supone 'un aumento sorprendente e importante en las capacidades de la IA'.
Sam Altman, CEO de OpenAI, ha declarado públicamente: 'Ahora estamos seguros de que sabemos cómo construir la AGI tal y como la hemos entendido tradicionalmente', y predice que 'en 2025 podríamos ver a los primeros agentes de IA incorporarse al mundo laboral y cambiar de manera significativa la productividad de las empresas'. Este calendario coincide con las previsiones de otros líderes del sector, como Elon Musk y Dario Amodei de Anthropic, quienes sugieren que los sistemas de IA podrían superar la inteligencia humana para 2026.
Vorhies imagina un futuro en el que los agentes de IA transformen los procesos laborales, dividiéndose en roles de 'arquitecto', que establecen objetivos de alto nivel, y 'ejecutores', que llevan a cabo tareas específicas. Aunque esto podría aumentar drásticamente la eficiencia en todos los sectores, advierte que también podría provocar una importante pérdida de empleos.
A pesar del entusiasmo, los expertos advierten que o3 aún falla en tareas simples y requiere enormes recursos computacionales. Se espera que el próximo benchmark ARC-AGI-2, que se lanzará en 2025, presente desafíos mucho mayores, lo que podría reducir el rendimiento de o3 a menos del 30%, mientras sigue siendo resoluble por humanos. Como señala Chollet: 'Sabremos que la AGI ha llegado cuando crear tareas que sean fáciles para los humanos pero difíciles para la IA sea simplemente imposible.'