OpenAI ha ampliato la sua gamma di modelli di ragionamento con il lancio di o3-mini, una nuova aggiunta compatta ma potente alla serie "o" che spinge i limiti di ciò che i modelli AI di piccole dimensioni possono raggiungere.
Presentato come il modello più efficiente in termini di costi della serie di ragionamento di OpenAI, o3-mini offre prestazioni eccezionali nei campi STEM mantenendo i bassi costi e la ridotta latenza del suo predecessore. Il modello amplia i confini di ciò che i piccoli modelli possono ottenere, offrendo capacità STEM di alto livello—con particolare forza in scienze, matematica e programmazione—il tutto mantenendo i costi bassi e la latenza ridotta di OpenAI o1-mini.
Come il suo predecessore o1, o3-mini è stato ottimizzato per il ragionamento STEM. Con uno sforzo di ragionamento medio, eguaglia le prestazioni di o1 in matematica, programmazione e scienze, offrendo risposte più rapide. Le valutazioni di tester esperti hanno mostrato che o3-mini produce risposte più accurate e chiare, con capacità di ragionamento superiori rispetto a o1-mini. I tester esterni hanno preferito le risposte di o3-mini rispetto a quelle di o1-mini in più della metà dei casi. Il modello ha inoltre commesso il 39% di "errori gravi" in meno su "domande difficili del mondo reale" nei test A/B rispetto a o1-mini, producendo risposte più "chiare" e fornendo risposte circa il 24% più velocemente.
Una delle principali innovazioni di o3-mini è la sua capacità di ragionamento flessibile. Gli sviluppatori possono scegliere tra tre livelli di sforzo di ragionamento—basso, medio e alto—per ottimizzare il modello in base alle proprie esigenze. Questa flessibilità consente a o3-mini di "pensare più a fondo" quando affronta sfide complesse o di privilegiare la velocità quando la latenza è una priorità.
Il modello è il primo modello di ragionamento compatto di OpenAI a supportare funzionalità molto richieste dagli sviluppatori, tra cui chiamata di funzioni, output strutturati e messaggi per sviluppatori, rendendolo pronto per la produzione fin dal lancio. Con questo rilascio, OpenAI ha triplicato il limite di messaggi per gli utenti Plus e Team, passando da 50 messaggi al giorno con o1-mini a 150 messaggi al giorno con o3-mini. Inoltre, o3-mini ora funziona con la ricerca per trovare risposte aggiornate con link a fonti web rilevanti. Da oggi, anche gli utenti del piano gratuito possono provare o3-mini selezionando 'Reason' nel compositore di messaggi o rigenerando una risposta—è la prima volta che un modello di ragionamento viene reso disponibile agli utenti gratuiti di ChatGPT.
Il lancio di o3-mini arriva in un momento strategico per OpenAI, mentre l'azienda si prepara al prossimo rilascio dei modelli più potenti o3 e o4-mini. In un post condiviso su X, il CEO Sam Altman ha annunciato che l'azienda rilascerà due nuovi modelli—o3 e o4-mini—nelle prossime settimane, mentre GPT-5 è ora previsto tra qualche mese. Da aprile 2025, o3-mini è stato completamente sostituito da o4-mini in ChatGPT e nell'API. o4-mini offre prestazioni migliori sulla maggior parte dei benchmark, aggiunge input multimodale nativo e mantiene la compatibilità con gli strumenti—il tutto rimanendo più veloce e conveniente rispetto a o3.