DeepSeek, čínský startup v oblasti umělé inteligence, se s nejnovější aktualizací modelu R1-0528 stal vážným konkurentem západní AI dominance a nyní dosahuje výkonu blížícího se lídrům jako OpenAI a Google.
Ačkoliv DeepSeek označuje novou verzi za „menší aktualizaci“, přináší model zásadní vylepšení v klíčových oblastech. V matematickém uvažování vzrostla přesnost modelu v náročném testu AIME 2025 ze 70 % na 87,5 %, což dokládá zlepšené schopnosti řešení problémů. Tento pokrok je výsledkem hlubšího uvažování modelu, který nyní při jednom dotazu využívá přibližně 23 000 tokenů oproti 12 000 v předchozí verzi.
Kromě matematiky vykazuje R1-0528 významné zlepšení i v programování. V programátorské soutěži Codeforces získal model rating přibližně 1930, což je o 400 bodů více než dříve (1530) – tento nárůst odráží lepší generování kódu i schopnost řešit úlohy. Výrazně se zlepšily také výsledky modelu v komplexních testech programování.
Pokrok modelu odpovídá zjištěním zprávy Stanfordské univerzity AI Index 2025, která dokumentuje dramatické zmenšení výkonové mezery mezi špičkovými americkými a čínskými AI modely. Podle zprávy se rozdíl mezi předními americkými a čínskými modely v hlavních benchmarcích zmenšil z dvouciferných hodnot v roce 2023 na téměř vyrovnaný stav začátkem roku 2025. Na žebříčku Chatbot Arena se rozdíl mezi nejlepšími americkými a čínskými modely snížil z 9,26 % v lednu 2024 na pouhých 1,70 % v únoru 2025.
Tohoto posunu si všimli i lídři v oboru. Generální ředitel Nvidie Jensen Huang v květnu uznal, že „DeepSeek a [Alibaba] Qwen z Číny patří mezi nejlepší open-source AI modely, které jsou volně dostupné. Získaly si pozornost v USA, Evropě i jinde.“
Úspěch DeepSeek je o to pozoruhodnější, že pochází od firmy, která začínala jako poměrně malý startup. Model je dostupný pod permisivní licencí, a to jak v plné verzi, tak v menší „destilované“ variantě, kterou lze provozovat i na méně výkonném hardwaru. Díky tomu jsou pokročilé AI schopnosti dostupnější vývojářům po celém světě.