DeepSeek vylepšuje AI model R1, vyzýva západných technologických gigantov

Čínsky startup DeepSeek vydal aktualizáciu svojho modelu R1 na rozumové úlohy, ktorý začiatkom roka katapultoval firmu do celosvetového povedomia. Aktualizácia R1-0528, ktorú spoločnosť označuje za „menšiu“, však prináša výrazné zlepšenia v programovaní, hĺbke uvažovania a písomných úlohách. Model si zároveň zachováva nákladovo efektívny prístup k vývoju AI a výkonom konkuruje modelom od OpenAI a Googlu.

DeepSeek, čínsky startup v oblasti umelej inteligencie, ktorý v januári spôsobil otras na technologických trhoch svojím prelomovým modelom R1, potichu predstavil významnú aktualizáciu svojho vlajkového AI systému.

Nová verzia, označená ako DeepSeek-R1-0528, bola vydaná 28. mája bez väčšej publicity prostredníctvom krátkeho oznámenia v skupine spoločnosti na WeChate. Hoci DeepSeek ju označuje za „menšiu skúšobnú aktualizáciu“, prvé testy ukazujú výrazné zlepšenia v rôznych oblastiach.

Podľa rebríčka LiveCodeBench sa aktualizovaný model aktuálne umiestňuje na štvrtom mieste v programovacích schopnostiach s hodnotením Pass@1 na úrovni 73,1, čím sa radí tesne za modely O3 a O4-Mini od OpenAI. Ide o výrazný pokrok pre open-source model, najmä ak vezmeme do úvahy, že bol vyvinutý s podstatne menšími zdrojmi než západná konkurencia.

Technické špecifikácie ukazujú, že R1-0528 si zachováva architektúru Mixture-of-Experts (MoE) svojho predchodcu s celkovým počtom približne 685 miliárd parametrov, pričom počas inferencie je aktívnych len asi 37 miliárd. Model teraz podporuje rozšírené kontextové okno až do 128 000 tokenov, čo mu umožňuje spracovávať oveľa väčšie dokumenty a kódy.

Spätná väzba od používateľov vyzdvihuje zlepšenia v hĺbke uvažovania, kvalite písania a schopnosti riešiť problémy. Vývojári uvádzajú, že model dokáže viesť rozšírené uvažovacie relácie trvajúce 30 až 60 minút pri zložitých úlohách, podobne ako modely od Googlu. Aktualizácia tiež rieši predchádzajúce nedostatky v generovaní textu a prináša prirodzenejší a lepšie formátovaný obsah.

Pokračujúca inovácia DeepSeek spochybňuje predstavu, že škálovanie AI si vyžaduje obrovský výpočtový výkon a investície. Úspech spoločnosti s nákladovo efektívnymi open-source modelmi už prinútil technologických gigantov reagovať – OpenAI znížil ceny a Google predstavil zľavnené prístupové úrovne. Medzitým čínski konkurenti ako Alibaba a Tencent uvádzajú vlastné modely, ktoré údajne prekonávajú schopnosti DeepSeek.

Aktualizácia R1-0528 je dostupná na platforme Hugging Face pod licenciou MIT, čo umožňuje komerčné využitie aj úpravy. Odborníci očakávajú, že DeepSeek v najbližších mesiacoch uvedie komplexnejší model R2, ktorý by mohol ešte výraznejšie zamiešať kartami na poli umelej inteligencie.

Source:

DeepSeek vylepšuje AI model R1, vyzýva západných technologických gigantov

Latest News

Google Beam: Revolučné 3D videohovory prichádzajú v roku 2025

Google predstavuje Gemini 2.5 Deep Think na I/O 2025

AMD získava Enosemi na podporu rozvoja kremíkovej fotoniky pre AI

Warrenová žiada Pentagón o zabezpečenie súťaže pri AI kontraktoch v čase rastúceho vplyvu Muska

ByteDance rozširuje Doubao AI o asistenciu v reálnom čase cez video

OnePlus nahrádza ikonický prepínač režimov novým AI tlačidlom Plus Key

Nemeckí technologickí giganti sa spájajú pre AI gigatováreň podporovanú EÚ

Americkí prokurátori vyšetrovali Builder.ai pred krachom AI startupu v hodnote 1,5 miliardy dolárov

Nórsky fond v hodnote 1,8 bilióna dolárov zavádza povinné využívanie AI pre zamestnancov

OpenTools.ai predstavuje AI News Hub pre technologických profesionálov

DeepSeek vylepšuje AI model R1, vyzýva západných technologických gigantov

Related Articles

Google predstavuje Gemini 2.5 Deep Think na I/O 2025

AMD získava Enosemi na podporu rozvoja kremíkovej fotoniky pre AI

Warrenová žiada Pentagón o zabezpečenie súťaže pri AI kontraktoch v čase rastúceho vplyvu Muska

ByteDance rozširuje Doubao AI o asistenciu v reálnom čase cez video

OnePlus nahrádza ikonický prepínač režimov novým AI tlačidlom Plus Key

Latest News

Google Beam: Revolučné 3D videohovory prichádzajú v roku 2025

Google predstavuje Gemini 2.5 Deep Think na I/O 2025

AMD získava Enosemi na podporu rozvoja kremíkovej fotoniky pre AI

Warrenová žiada Pentagón o zabezpečenie súťaže pri AI kontraktoch v čase rastúceho vplyvu Muska

ByteDance rozširuje Doubao AI o asistenciu v reálnom čase cez video

OnePlus nahrádza ikonický prepínač režimov novým AI tlačidlom Plus Key

Nemeckí technologickí giganti sa spájajú pre AI gigatováreň podporovanú EÚ

Americkí prokurátori vyšetrovali Builder.ai pred krachom AI startupu v hodnote 1,5 miliardy dolárov

Nórsky fond v hodnote 1,8 bilióna dolárov zavádza povinné využívanie AI pre zamestnancov

OpenTools.ai predstavuje AI News Hub pre technologických profesionálov