AI modeli sada uče provoditi više vremena na složenim problemima

Razvijen je revolucionarni AI model koji uči raspoređivati više računalnih resursa na teže probleme, oponašajući način na koji ljudi posvećuju više vremena zahtjevnim zadacima. Ova prilagodljiva sposobnost zaključivanja omogućuje robusnija rješenja i bolju generalizaciju na nove, neviđene situacije. Inovacija predstavlja značajan napredak u rješavanju problema pomoću umjetne inteligencije, prelazeći granice prepoznavanja obrazaca prema procesima zaključivanja sličnim ljudskima.

Istraživači su razvili novu generaciju AI modela koji mogu dinamički prilagođavati svoj računalni napor ovisno o složenosti problema, što predstavlja veliku promjenu u načinu na koji umjetna inteligencija pristupa zahtjevnim zadacima.

Tehnologija, koju predstavljaju modeli poput DeepSeek-R1 i OpenAI-jevih o-serija, koristi ono što razvojni inženjeri nazivaju "pristupom zaključivanja na prvom mjestu" (reasoning-first approach), koji daje prednost temeljitoj analizi u odnosu na brzo prepoznavanje obrazaca. DeepSeek-R1 je izgrađen upravo na toj metodologiji, što ga čini posebno pogodnim za rješavanje složenih zadataka u znanosti, programiranju i matematici putem naprednog logičkog zaključivanja i rješavanja problema. Ovakav fokus na "razmišljanje prije odgovora" posebno je vrijedan za tehničke primjene.

Za razliku od konvencionalnih AI sustava, ovi novi modeli zaključivanja trenirani su da "razmišljaju dulje" prije nego što odgovore. Primjerice, OpenAI-jev o3 može razložiti teška pitanja na logičke korake, izvoditi međukalkulacije ili koristiti alate, a zatim ponuditi utemeljene odgovore. Budući da su modeli zaključivanja, učinkovito sami provjeravaju činjenice, što pomaže izbjeći zamke u koje standardni modeli često upadaju. Iako im treba nekoliko sekundi do nekoliko minuta više da dođu do rješenja u odnosu na tipične modele bez zaključivanja, pouzdaniji su u područjima poput fizike, znanosti i matematike.

OpenAI je primijetio da učenja pojačanja velikih razmjera pokazuju isti trend "više računalnih resursa = bolje performanse" kao i kod ranijih modela. Ponovnim praćenjem tog puta skaliranja—ovaj put u učenju pojačanjem—postigli su dodatni red veličine u računanju tijekom treniranja i zaključivanja, uz jasna poboljšanja performansi koja potvrđuju da se učinkovitost modela nastavlja povećavati što im se više vremena za razmišljanje dopusti.

Ovi modeli aktivno generiraju više mogućih rješenja tijekom zaključivanja, a svako procjenjuju uz pomoć integriranih evaluacijskih modela kako bi odabrali najperspektivniju opciju. Trenirajući evaluator na podacima označenim od strane stručnjaka, razvojni inženjeri osiguravaju da modeli razviju snažnu sposobnost zaključivanja kroz složene, višekoračne probleme. Ova značajka omogućuje modelu da djeluje kao sudac vlastitog zaključivanja, čime se veliki jezični modeli približavaju mogućnosti "razmišljanja" umjesto pukog odgovaranja.

DeepSeekov pristup kombinira zaključivanje putem lanca misli (chain-of-thought reasoning) s učenjem pojačanjem, gdje autonomni agent uči izvršavati zadatak kroz pokušaje i pogreške bez ljudskih uputa. Ovo dovodi u pitanje pretpostavku da će se sposobnost zaključivanja modela poboljšavati isključivo treniranjem na označenim primjerima ispravnog ponašanja. Kako je jedan istraživač rekao: "Možemo li jednostavno nagraditi model za točnost i pustiti ga da sam otkrije najbolji način razmišljanja?"

Implikacije za primjenu u stvarnom svijetu su duboke. Ovi modeli mogli bi transformirati način na koji AI rješava složene probleme u područjima od znanstvenih istraživanja i inženjerstva do poslovne strategije i kreativnog rješavanja problema. Raspoređujući računalne resurse proporcionalno težini zadatka—slično kao što ljudi prirodno provode više vremena na težim problemima—ovi sustavi obećavaju pouzdanije rezultate na najzahtjevnijim intelektualnim zadacima s kojima se čovječanstvo suočava.

Source:

AI modeli sada uče provoditi više vremena na složenim problemima

Latest News

Google preotima Windsurf AI talente u strateškom ugovoru vrijednom 2,4 milijarde dolara

OpenTools.ai pokreće dnevni AI news hub za tehnološke profesionalce

HP preuzima Humaneove AI resurse za 116 milijuna dolara i ukida AI Pin

Nvidia ispisuje povijest kao prvi tehnološki div vrijedan 4 bilijuna dolara

Kineska AI tvrtka DeepSeek smanjuje zaostatak za zapadnim divovima

Povijesni Zakon EU-a o umjetnoj inteligenciji ulazi u fazu provedbe

xAI uklanja antisemitski sadržaj iz Groka usred promjena u vodstvu

OpenAI i Microsoft pokreću AI akademiju vrijednu 23 milijuna dolara za 400.000 učitelja

Google predstavlja napredne AI alate za transformaciju zdravstvene skrbi

EU odbija zahtjeve za odgodom smjernica za usklađivanje s AI Aktom

AI modeli sada uče provoditi više vremena na složenim problemima

Related Articles

HP preuzima Humaneove AI resurse za 116 milijuna dolara i ukida AI Pin

OpenTools.ai pokreće dnevni AI news hub za tehnološke profesionalce

Google preotima Windsurf AI talente u strateškom ugovoru vrijednom 2,4 milijarde dolara

xAI uklanja antisemitski sadržaj iz Groka usred promjena u vodstvu

Povijesni Zakon EU-a o umjetnoj inteligenciji ulazi u fazu provedbe

Latest News

Google preotima Windsurf AI talente u strateškom ugovoru vrijednom 2,4 milijarde dolara

OpenTools.ai pokreće dnevni AI news hub za tehnološke profesionalce

HP preuzima Humaneove AI resurse za 116 milijuna dolara i ukida AI Pin

Nvidia ispisuje povijest kao prvi tehnološki div vrijedan 4 bilijuna dolara

Kineska AI tvrtka DeepSeek smanjuje zaostatak za zapadnim divovima

Povijesni Zakon EU-a o umjetnoj inteligenciji ulazi u fazu provedbe

xAI uklanja antisemitski sadržaj iz Groka usred promjena u vodstvu

OpenAI i Microsoft pokreću AI akademiju vrijednu 23 milijuna dolara za 400.000 učitelja

Google predstavlja napredne AI alate za transformaciju zdravstvene skrbi

EU odbija zahtjeve za odgodom smjernica za usklađivanje s AI Aktom