DeepSeek, čínský startup v oblasti umělé inteligence, který v lednu způsobil propad technologických akcií svým průlomovým modelem R1, tiše uvedl významnou aktualizaci svého vlajkového AI systému.
Nová verze s označením DeepSeek-R1-0528 byla vydána 28. května bez větší publicity prostřednictvím krátkého oznámení ve firemní skupině na WeChatu. Přestože DeepSeek aktualizaci označuje jako „menší zkušební upgrade“, první testy ukazují výrazné zlepšení v několika oblastech.
Podle žebříčku LiveCodeBench se aktualizovaný model nyní umístil na čtvrtém místě v programovacích schopnostech s výsledkem Pass@1 73,1, což jej řadí těsně za modely O3 a O4-Mini od OpenAI. Jde o významný pokrok pro open-source model, zvlášť když byl vyvinut s výrazně menšími zdroji než jeho západní konkurenti.
Technické specifikace ukazují, že R1-0528 si zachovává architekturu Mixture-of-Experts (MoE) svého předchůdce s celkovým počtem přibližně 685 miliard parametrů, z nichž při inferenci je aktivních pouze asi 37 miliard. Model nyní podporuje rozšířené kontextové okno až 128 000 tokenů, což umožňuje zpracovávat mnohem větší dokumenty a kódové základny.
Uživatelská zpětná vazba zdůrazňuje zlepšení v hloubce uvažování, kvalitě psaní i schopnosti řešit problémy. Vývojáři hlásí, že model nyní zvládá dlouhé logické seance trvající 30–60 minut u složitých úkolů, podobně jako modely od Googlu. Aktualizace také řeší předchozí nedostatky v generování textu a přináší přirozenější a lépe formátovaný obsah.
Pokračující inovace DeepSeek zpochybňují představu, že škálování AI vyžaduje obrovský výpočetní výkon a investice. Úspěch společnosti s nákladově efektivními open-source modely již donutil technologické giganty reagovat – OpenAI snížila ceny a Google zavedl zvýhodněné úrovně přístupu. Mezitím čínští konkurenti jako Alibaba a Tencent představili vlastní modely, které údajně překonávají schopnosti DeepSeek.
Aktualizace R1-0528 je dostupná na platformě Hugging Face pod licencí MIT, což umožňuje komerční využití i úpravy. Odborníci očekávají, že DeepSeek v následujících měsících uvede komplexnější model R2, který by mohl dále narušit trh s AI.