menu
close

DeepSeek vylepšuje model R1 a vyzývá západní technologické giganty

Čínský startup DeepSeek vydal aktualizaci svého modelu R1 pro logické uvažování, který letos vynesl firmu do celosvětového povědomí. Aktualizace R1-0528, kterou společnost označuje za „menší“, přináší výrazná zlepšení v programování, hloubce uvažování i psaní. Model si zachovává nákladově efektivní přístup k vývoji AI a zároveň výkonem konkuruje modelům od OpenAI a Googlu.
DeepSeek vylepšuje model R1 a vyzývá západní technologické giganty

DeepSeek, čínský startup v oblasti umělé inteligence, který v lednu způsobil propad technologických akcií svým průlomovým modelem R1, tiše uvedl významnou aktualizaci svého vlajkového AI systému.

Nová verze s označením DeepSeek-R1-0528 byla vydána 28. května bez větší publicity prostřednictvím krátkého oznámení ve firemní skupině na WeChatu. Přestože DeepSeek aktualizaci označuje jako „menší zkušební upgrade“, první testy ukazují výrazné zlepšení v několika oblastech.

Podle žebříčku LiveCodeBench se aktualizovaný model nyní umístil na čtvrtém místě v programovacích schopnostech s výsledkem Pass@1 73,1, což jej řadí těsně za modely O3 a O4-Mini od OpenAI. Jde o významný pokrok pro open-source model, zvlášť když byl vyvinut s výrazně menšími zdroji než jeho západní konkurenti.

Technické specifikace ukazují, že R1-0528 si zachovává architekturu Mixture-of-Experts (MoE) svého předchůdce s celkovým počtem přibližně 685 miliard parametrů, z nichž při inferenci je aktivních pouze asi 37 miliard. Model nyní podporuje rozšířené kontextové okno až 128 000 tokenů, což umožňuje zpracovávat mnohem větší dokumenty a kódové základny.

Uživatelská zpětná vazba zdůrazňuje zlepšení v hloubce uvažování, kvalitě psaní i schopnosti řešit problémy. Vývojáři hlásí, že model nyní zvládá dlouhé logické seance trvající 30–60 minut u složitých úkolů, podobně jako modely od Googlu. Aktualizace také řeší předchozí nedostatky v generování textu a přináší přirozenější a lépe formátovaný obsah.

Pokračující inovace DeepSeek zpochybňují představu, že škálování AI vyžaduje obrovský výpočetní výkon a investice. Úspěch společnosti s nákladově efektivními open-source modely již donutil technologické giganty reagovat – OpenAI snížila ceny a Google zavedl zvýhodněné úrovně přístupu. Mezitím čínští konkurenti jako Alibaba a Tencent představili vlastní modely, které údajně překonávají schopnosti DeepSeek.

Aktualizace R1-0528 je dostupná na platformě Hugging Face pod licencí MIT, což umožňuje komerční využití i úpravy. Odborníci očekávají, že DeepSeek v následujících měsících uvede komplexnější model R2, který by mohl dále narušit trh s AI.

Source:

Latest News