OpenAI ha ampliado su línea de modelos de razonamiento con el lanzamiento de o3-mini, una adición más compacta pero poderosa a su serie "o" que lleva los límites de lo que los modelos de IA pequeños pueden lograr.
Presentado como el modelo más rentable de la serie de razonamiento de OpenAI, o3-mini ofrece un rendimiento excepcional en campos STEM, manteniendo el bajo costo y la latencia reducida de su predecesor. El modelo amplía los límites de lo que los modelos pequeños pueden alcanzar, brindando capacidades STEM sobresalientes—con especial fortaleza en ciencia, matemáticas y programación—todo mientras mantiene el bajo costo y la baja latencia de OpenAI o1-mini.
Al igual que su predecesor o1, o3-mini ha sido optimizado para el razonamiento en STEM. Con un esfuerzo de razonamiento medio, iguala el desempeño de o1 en matemáticas, programación y ciencia, además de ofrecer respuestas más rápidas. Las evaluaciones realizadas por expertos demostraron que o3-mini produce respuestas más precisas y claras, con mejores habilidades de razonamiento, que o1-mini. Los evaluadores externos prefirieron las respuestas de o3-mini sobre las de o1-mini en más de la mitad de los casos. El modelo también cometió un 39% menos de "errores graves" en "preguntas difíciles del mundo real" en pruebas A/B frente a o1-mini, y generó respuestas "más claras" mientras entregaba respuestas aproximadamente un 24% más rápido.
Una de las principales innovaciones de o3-mini es su capacidad de razonamiento flexible. Los desarrolladores pueden elegir entre tres opciones de esfuerzo de razonamiento—bajo, medio y alto—para optimizar según sus casos de uso específicos. Esta flexibilidad permite que o3-mini "piense más a fondo" al enfrentar desafíos complejos o priorice la velocidad cuando la latencia es una preocupación.
El modelo es el primer modelo pequeño de razonamiento de OpenAI que admite funciones muy solicitadas por desarrolladores, incluyendo llamadas a funciones, salidas estructuradas y mensajes para desarrolladores, haciéndolo listo para producción desde su lanzamiento. Como parte de este lanzamiento, OpenAI ha triplicado el límite de mensajes para usuarios Plus y Team, pasando de 50 mensajes diarios con o1-mini a 150 mensajes diarios con o3-mini. Además, o3-mini ahora funciona con búsqueda para encontrar respuestas actualizadas con enlaces a fuentes web relevantes. Desde hoy, los usuarios del plan gratuito también pueden probar o3-mini seleccionando 'Reason' en el compositor de mensajes o regenerando una respuesta—marcando la primera vez que un modelo de razonamiento está disponible para usuarios gratuitos en ChatGPT.
El lanzamiento de o3-mini llega en un momento estratégico para OpenAI, ya que la empresa se prepara para el próximo lanzamiento de sus modelos más potentes o3 y o4-mini. En una publicación compartida en X, el CEO Sam Altman anunció que la compañía lanzará dos nuevos modelos—o3 y o4-mini—en las próximas semanas, mientras que GPT-5 se espera ahora algunos meses después. A partir de abril de 2025, o3-mini ha sido completamente reemplazado por o4-mini en ChatGPT y la API. o4-mini ofrece un mejor rendimiento en la mayoría de los benchmarks, añade entrada multimodal nativa y mantiene la compatibilidad con herramientas—todo mientras sigue siendo más rápido y asequible que o3.