Istraživači su razvili novu generaciju AI modela koji mogu dinamički prilagođavati svoj računalni napor ovisno o složenosti problema, što predstavlja veliku promjenu u načinu na koji umjetna inteligencija pristupa zahtjevnim zadacima.
Tehnologija, koju predstavljaju modeli poput DeepSeek-R1 i OpenAI-jevih o-serija, koristi ono što razvojni inženjeri nazivaju "pristupom zaključivanja na prvom mjestu" (reasoning-first approach), koji daje prednost temeljitoj analizi u odnosu na brzo prepoznavanje obrazaca. DeepSeek-R1 je izgrađen upravo na toj metodologiji, što ga čini posebno pogodnim za rješavanje složenih zadataka u znanosti, programiranju i matematici putem naprednog logičkog zaključivanja i rješavanja problema. Ovakav fokus na "razmišljanje prije odgovora" posebno je vrijedan za tehničke primjene.
Za razliku od konvencionalnih AI sustava, ovi novi modeli zaključivanja trenirani su da "razmišljaju dulje" prije nego što odgovore. Primjerice, OpenAI-jev o3 može razložiti teška pitanja na logičke korake, izvoditi međukalkulacije ili koristiti alate, a zatim ponuditi utemeljene odgovore. Budući da su modeli zaključivanja, učinkovito sami provjeravaju činjenice, što pomaže izbjeći zamke u koje standardni modeli često upadaju. Iako im treba nekoliko sekundi do nekoliko minuta više da dođu do rješenja u odnosu na tipične modele bez zaključivanja, pouzdaniji su u područjima poput fizike, znanosti i matematike.
OpenAI je primijetio da učenja pojačanja velikih razmjera pokazuju isti trend "više računalnih resursa = bolje performanse" kao i kod ranijih modela. Ponovnim praćenjem tog puta skaliranja—ovaj put u učenju pojačanjem—postigli su dodatni red veličine u računanju tijekom treniranja i zaključivanja, uz jasna poboljšanja performansi koja potvrđuju da se učinkovitost modela nastavlja povećavati što im se više vremena za razmišljanje dopusti.
Ovi modeli aktivno generiraju više mogućih rješenja tijekom zaključivanja, a svako procjenjuju uz pomoć integriranih evaluacijskih modela kako bi odabrali najperspektivniju opciju. Trenirajući evaluator na podacima označenim od strane stručnjaka, razvojni inženjeri osiguravaju da modeli razviju snažnu sposobnost zaključivanja kroz složene, višekoračne probleme. Ova značajka omogućuje modelu da djeluje kao sudac vlastitog zaključivanja, čime se veliki jezični modeli približavaju mogućnosti "razmišljanja" umjesto pukog odgovaranja.
DeepSeekov pristup kombinira zaključivanje putem lanca misli (chain-of-thought reasoning) s učenjem pojačanjem, gdje autonomni agent uči izvršavati zadatak kroz pokušaje i pogreške bez ljudskih uputa. Ovo dovodi u pitanje pretpostavku da će se sposobnost zaključivanja modela poboljšavati isključivo treniranjem na označenim primjerima ispravnog ponašanja. Kako je jedan istraživač rekao: "Možemo li jednostavno nagraditi model za točnost i pustiti ga da sam otkrije najbolji način razmišljanja?"
Implikacije za primjenu u stvarnom svijetu su duboke. Ovi modeli mogli bi transformirati način na koji AI rješava složene probleme u područjima od znanstvenih istraživanja i inženjerstva do poslovne strategije i kreativnog rješavanja problema. Raspoređujući računalne resurse proporcionalno težini zadatka—slično kao što ljudi prirodno provode više vremena na težim problemima—ovi sustavi obećavaju pouzdanije rezultate na najzahtjevnijim intelektualnim zadacima s kojima se čovječanstvo suočava.