menu
close

I modelli di IA ora imparano a dedicare più tempo ai problemi complessi

È stato sviluppato un modello di intelligenza artificiale rivoluzionario che apprende a destinare maggiori risorse computazionali ai problemi difficili, imitando il modo in cui gli esseri umani dedicano più tempo ai compiti impegnativi. Questa capacità di ragionamento adattivo consente soluzioni più robuste e una migliore generalizzazione a scenari nuovi e mai visti prima. L’innovazione rappresenta un importante passo avanti nella risoluzione dei problemi da parte dell’IA, andando oltre il riconoscimento di pattern verso processi di ragionamento più simili a quelli umani.
I modelli di IA ora imparano a dedicare più tempo ai problemi complessi

I ricercatori hanno sviluppato una nuova generazione di modelli di intelligenza artificiale in grado di regolare dinamicamente lo sforzo computazionale in base alla complessità del problema, segnando un cambiamento radicale nell’approccio dell’IA ai compiti più impegnativi.

Questa tecnologia, rappresentata da modelli come DeepSeek-R1 e la serie o di OpenAI, adotta quello che gli sviluppatori definiscono un "approccio basato sul ragionamento", che privilegia un’analisi approfondita rispetto a un rapido riconoscimento di pattern. DeepSeek-R1 è stato progettato proprio con questa metodologia, risultando particolarmente adatto ad affrontare compiti complessi in ambito scientifico, nella programmazione e nella matematica, grazie a capacità avanzate di inferenza logica e problem solving. Questo focus sul "pensare prima di rispondere" lo rende particolarmente prezioso per applicazioni tecniche.

A differenza dei sistemi di IA convenzionali, questi nuovi modelli di ragionamento sono addestrati per "pensare più a lungo" prima di fornire una risposta. Ad esempio, OpenAI o3 è in grado di suddividere domande difficili in passaggi logici, eseguire calcoli intermedi o chiamate a strumenti, e poi produrre risposte ben motivate. Essendo modelli di ragionamento, sono in grado di verificare autonomamente la correttezza delle proprie risposte, evitando così gli errori tipici dei modelli standard. Sebbene impieghino da alcuni secondi a diversi minuti in più per arrivare a una soluzione rispetto ai modelli non basati sul ragionamento, tendono a essere più affidabili in ambiti come fisica, scienza e matematica.

OpenAI ha osservato che l’apprendimento per rinforzo su larga scala mostra la stessa tendenza "più calcolo = migliori prestazioni" già vista nell’addestramento dei modelli precedenti. Ripercorrendo il percorso di scaling — questa volta nell’apprendimento per rinforzo — sono riusciti ad aumentare di un ordine di grandezza sia la potenza di calcolo per l’addestramento sia il ragionamento in fase di inferenza, con chiari miglioramenti che confermano come le prestazioni dei modelli continuino a crescere quanto più viene loro concesso di "pensare".

Questi modelli generano attivamente più percorsi di soluzione durante l’inferenza, valutando ciascuno con l’aiuto di modelli valutatori integrati per determinare l’opzione più promettente. Addestrando il valutatore su dati etichettati da esperti, gli sviluppatori garantiscono che i modelli acquisiscano una solida capacità di ragionare su problemi complessi e multi-step. Questa caratteristica consente al modello di fungere da giudice del proprio ragionamento, avvicinando i grandi modelli linguistici alla capacità di "pensare" piuttosto che semplicemente rispondere.

L’approccio di DeepSeek combina il ragionamento a catena di pensieri con l’apprendimento per rinforzo, in cui un agente autonomo impara a svolgere un compito tramite tentativi ed errori, senza istruzioni umane. Questo mette in discussione l’assunto che i modelli migliorino la propria capacità di ragionamento solo attraverso l’addestramento su esempi etichettati di comportamento corretto. Come ha affermato un ricercatore: "Possiamo semplicemente premiare il modello per la correttezza e lasciargli scoprire da solo il modo migliore di pensare?"

Le implicazioni per le applicazioni nel mondo reale sono profonde. Questi modelli potrebbero trasformare il modo in cui l’IA affronta problemi complessi in settori che vanno dalla ricerca scientifica e l’ingegneria alla strategia aziendale e alla risoluzione creativa dei problemi. Allocando risorse computazionali in proporzione alla difficoltà del compito — proprio come gli esseri umani dedicano naturalmente più tempo ai problemi più ardui — questi sistemi promettono prestazioni più affidabili sulle sfide intellettuali più impegnative che l’umanità si trova ad affrontare.

Source:

Latest News