menu
close

DeepSeek unapređuje Alibabin AI kroz destilaciju znanja

Kineski AI startup DeepSeek objavio je 29. svibnja 2025. da je unaprijedio Alibabin Qwen 3 8B Base model koristeći proces destilacije znanja sa svojim ažuriranim R1-0528 modelom za zaključivanje. Tehnika destilacije prenijela je DeepSeekove napredne sposobnosti zaključivanja na Alibabin model, što je rezultiralo poboljšanjem performansi većim od 10%. Ova suradnja naglašava rastući utjecaj DeepSeeka u AI sektoru i njihovu predanost unapređenju učinkovitosti modela inovativnim optimizacijskim pristupima.
DeepSeek unapređuje Alibabin AI kroz destilaciju znanja

Kineski AI startup DeepSeek nastavlja mijenjati globalni krajolik umjetne inteligencije svojom najnovijom inovacijom u optimizaciji modela. Tvrtka je 29. svibnja otkrila da je varijanta njezinog nedavno ažuriranog R1-0528 modela za zaključivanje korištena za poboljšanje Alibabinog Qwen 3 8B Base modela putem procesa poznatog kao destilacija.

Tehnika destilacije, koja prenosi znanje s sofisticiranijeg modela na manji, omogućila je DeepSeeku da procese zaključivanja iz svog R1-0528 modela prenese na Alibabin sustav. Prema DeepSeekovoj objavi, ovaj proces doveo je do poboljšanja performansi većih od 10% za Qwen 3 model.

"Vjerujemo da će chain-of-thought iz DeepSeek-R1-0528 imati značajnu važnost i za akademska istraživanja i za praktične primjene", navodi DeepSeek u svojoj objavi. Tvrtka je prethodno objavila nekoliko destiliranih modela temeljenih na Qwen i Meta Llama arhitekturama, s veličinama od 1,5B do 70B parametara.

DeepSeekov pristup razvoju umjetne inteligencije privukao je veliku pažnju još od siječnja, kada je njihov R1 model pokazao performanse usporedive s ponudama OpenAI-ja i Googlea, ali uz znatno niže računalne troškove. Uspjeh tvrtke osporio je prevladavajuće mišljenje da vrhunska umjetna inteligencija zahtijeva ogromne računalne resurse i ulaganja.

Unatoč američkim izvoznim ograničenjima na napredne AI čipove, DeepSeek je optimizirao svoje modele za učinkovito izvođenje na slabijem, izvozno odobrenom hardveru. Ova strategija natjerala je konkurente da preispitaju svoju ovisnost o hardveru i utjecala na dinamiku tržišta u AI sektoru.

Najnovije ažuriranje R1-0528 dovodi DeepSeekov model bliže performansama OpenAI-jevih o3 modela za zaključivanje i Googleovog Gemini 2.5 Pro, uz značajna poboljšanja u dubini zaključivanja, sposobnostima inferencije i smanjenju halucinacija. Kontinuirana inovacija i open-source pristup tvrtke mijenjaju očekivanja u razvoju i učinkovitosti implementacije AI modela.

Source:

Latest News