menu
close

DeepSeek prichádza s vylepšeným modelom R1, ktorý konkuruje AI gigantom v oblasti rozumovania

Čínsky startup DeepSeek vydal R1-0528, významný upgrade svojho open-source modelu na rozumovanie, ktorý teraz konkuruje proprietárnym riešeniam od OpenAI a Google. Vylepšený model dosahuje dramaticky vyššiu matematickú presnosť – na teste AIME 2025 sa zvýšila z 70 % na 87,5 % zdvojnásobením kapacity rozumovania. DeepSeek zároveň predstavil menšiu, destilovanú verziu s 8 miliardami parametrov, ktorá beží na jednej GPU a pritom si zachováva pôsobivý výkon.
DeepSeek prichádza s vylepšeným modelom R1, ktorý konkuruje AI gigantom v oblasti rozumovania

DeepSeek, čínsky startup v oblasti umelej inteligencie, výrazne vylepšil svoj open-source model na rozumovanie vydaním verzie R1-0528, čím sa jeho výkon priblížil lídrom v odvetví ako OpenAI o3 a Google Gemini 2.5 Pro.

Tento upgrade predstavuje zásadný pokrok v rozumovacích schopnostiach DeepSeeku vďaka zvýšeným výpočtovým zdrojom a optimalizácii algoritmov. V benchmarkových testoch model ukázal pozoruhodné zlepšenie matematického rozumovania – presnosť na matematickom teste AIME 2025 stúpla zo 70 % na 87,5 %. Toto zlepšenie je výsledkom väčšej hĺbky rozumovania, keďže model teraz pri jednej otázke využíva v priemere 23 000 tokenov oproti predchádzajúcim 12 000.

Okrem matematických vylepšení ponúka R1-0528 viacero nových funkcií, ktoré ho robia atraktívnejším pre vývojárov. Model teraz podporuje systémové promptovanie, volanie funkcií a výstup v JSON formáte, čo uľahčuje jeho integráciu do aplikácií. Zároveň vykazuje nižšiu mieru halucinácií – podľa údajov klesla o 45–50 % pri úlohách prepísania a sumarizácie – a poskytuje lepšiu podporu pre tzv. vibe coding, kde vývojári generujú kód pomocou prirodzeného jazyka.

Pre používateľov s obmedzenými zdrojmi DeepSeek predstavil aj destilovanú verziu s názvom DeepSeek-R1-0528-Qwen3-8B. Táto menšia verzia vznikla doladením modelu Qwen3 8B od Alibaby pomocou rozumovacích vzorcov z plného R1-0528. Dokáže bežať na jednej bežnej GPU a pritom prekonáva Google Gemini 2.5 Flash v niektorých matematických benchmarkoch a takmer sa vyrovná modelu Microsoft Phi 4 reasoning plus.

Rovnako ako jeho predchodca, aj R1-0528 je dostupný pod permisívnou MIT licenciou, čo umožňuje komerčné využitie a úpravy. Hlavní poskytovatelia cloudových služieb, vrátane Amazon Web Services a Microsoft Azure, už ponúkajú modely DeepSeek svojim klientom, pričom ich však izolujú od čínskych serverov na zabezpečenie ochrany dát.

Toto vydanie ešte viac upevňuje pozíciu DeepSeeku a Meta ako lídrov v oblasti open-source AI, keďže poskytujú výkonné alternatívy k proprietárnym modelom od OpenAI, Google, Microsoftu a Anthropic, a to za zlomok výpočtových nákladov.

Source:

Latest News