DeepSeek unapređuje Alibabin AI kroz destilaciju znanja

Kineski AI startup DeepSeek objavio je 29. svibnja 2025. da je unaprijedio Alibabin Qwen 3 8B Base model koristeći proces destilacije znanja sa svojim ažuriranim R1-0528 modelom za zaključivanje. Tehnika destilacije prenijela je DeepSeekove napredne sposobnosti zaključivanja na Alibabin model, što je rezultiralo poboljšanjem performansi većim od 10%. Ova suradnja naglašava rastući utjecaj DeepSeeka u AI sektoru i njihovu predanost unapređenju učinkovitosti modela inovativnim optimizacijskim pristupima.

Kineski AI startup DeepSeek nastavlja mijenjati globalni krajolik umjetne inteligencije svojom najnovijom inovacijom u optimizaciji modela. Tvrtka je 29. svibnja otkrila da je varijanta njezinog nedavno ažuriranog R1-0528 modela za zaključivanje korištena za poboljšanje Alibabinog Qwen 3 8B Base modela putem procesa poznatog kao destilacija.

Tehnika destilacije, koja prenosi znanje s sofisticiranijeg modela na manji, omogućila je DeepSeeku da procese zaključivanja iz svog R1-0528 modela prenese na Alibabin sustav. Prema DeepSeekovoj objavi, ovaj proces doveo je do poboljšanja performansi većih od 10% za Qwen 3 model.

"Vjerujemo da će chain-of-thought iz DeepSeek-R1-0528 imati značajnu važnost i za akademska istraživanja i za praktične primjene", navodi DeepSeek u svojoj objavi. Tvrtka je prethodno objavila nekoliko destiliranih modela temeljenih na Qwen i Meta Llama arhitekturama, s veličinama od 1,5B do 70B parametara.

DeepSeekov pristup razvoju umjetne inteligencije privukao je veliku pažnju još od siječnja, kada je njihov R1 model pokazao performanse usporedive s ponudama OpenAI-ja i Googlea, ali uz znatno niže računalne troškove. Uspjeh tvrtke osporio je prevladavajuće mišljenje da vrhunska umjetna inteligencija zahtijeva ogromne računalne resurse i ulaganja.

Unatoč američkim izvoznim ograničenjima na napredne AI čipove, DeepSeek je optimizirao svoje modele za učinkovito izvođenje na slabijem, izvozno odobrenom hardveru. Ova strategija natjerala je konkurente da preispitaju svoju ovisnost o hardveru i utjecala na dinamiku tržišta u AI sektoru.

Najnovije ažuriranje R1-0528 dovodi DeepSeekov model bliže performansama OpenAI-jevih o3 modela za zaključivanje i Googleovog Gemini 2.5 Pro, uz značajna poboljšanja u dubini zaključivanja, sposobnostima inferencije i smanjenju halucinacija. Kontinuirana inovacija i open-source pristup tvrtke mijenjaju očekivanja u razvoju i učinkovitosti implementacije AI modela.

Source:

DeepSeek unapređuje Alibabin AI kroz destilaciju znanja

Latest News

DeepSeek nadograđuje R1 AI model, izaziva zapadne tehnološke divove

Google Beam: Revolucionarni 3D video pozivi stižu 2025.

Google Predstavlja Gemini 2.5 Deep Think na I/O 2025

AMD preuzima Enosemi radi napretka u silicijskoj fotonici za umjetnu inteligenciju

Warren traži od Pentagona osiguranje konkurencije u AI ugovorima zbog rastućeg utjecaja Muska

Caltechov ATMO robot transformira se u zraku za besprijekorne operacije na tlu

Google predstavlja Project Astra i AI Mode na I/O 2025

AI sustavi nadmašili ljude na testovima emocionalne inteligencije

Doubao AI tvrtke ByteDance sada nudi pomoć u stvarnom vremenu putem videopoziva

OnePlus zamjenjuje Alert Slider novom AI tipkom Plus Key

DeepSeek unapređuje Alibabin AI kroz destilaciju znanja

Related Articles

DeepSeek nadograđuje R1 AI model, izaziva zapadne tehnološke divove

Google Predstavlja Gemini 2.5 Deep Think na I/O 2025

AMD preuzima Enosemi radi napretka u silicijskoj fotonici za umjetnu inteligenciju

Warren traži od Pentagona osiguranje konkurencije u AI ugovorima zbog rastućeg utjecaja Muska

Google predstavlja Project Astra i AI Mode na I/O 2025

Latest News

DeepSeek nadograđuje R1 AI model, izaziva zapadne tehnološke divove

Google Beam: Revolucionarni 3D video pozivi stižu 2025.

Google Predstavlja Gemini 2.5 Deep Think na I/O 2025

AMD preuzima Enosemi radi napretka u silicijskoj fotonici za umjetnu inteligenciju

Warren traži od Pentagona osiguranje konkurencije u AI ugovorima zbog rastućeg utjecaja Muska

Caltechov ATMO robot transformira se u zraku za besprijekorne operacije na tlu

Google predstavlja Project Astra i AI Mode na I/O 2025

AI sustavi nadmašili ljude na testovima emocionalne inteligencije

Doubao AI tvrtke ByteDance sada nudi pomoć u stvarnom vremenu putem videopoziva

OnePlus zamjenjuje Alert Slider novom AI tipkom Plus Key