DeepSeek, en kinesisk AI-startup, har etablerat sig som en stark utmanare till västerländsk AI-dominans med sin senaste uppdatering av R1-0528-modellen, som nu presterar på nivåer nära branschledarna OpenAI och Google.
Den uppgraderade modellen, som DeepSeek själva beskriver som en "mindre versionsuppdatering", innebär ändå betydande förbättringar inom flera viktiga områden. Inom matematisk problemlösning ökade modellens noggrannhet på det krävande AIME 2025-testet från 70 % till 87,5 %, vilket visar på förbättrade problemlösningsförmågor. Framsteget beror på modellens fördjupade resonemang, där den nu använder cirka 23 000 tokens per fråga jämfört med 12 000 i föregående version.
Utöver matematik visar R1-0528 även tydliga framsteg inom programmering. På programmeringstävlingen Codeforces nådde modellen ett betyg på cirka 1930, upp från 1530 tidigare – en förbättring med 400 poäng som speglar bättre kodgenerering och problemlösningsförmåga. Även på omfattande kodningstester har modellen visat påtagliga förbättringar.
Modellens framsteg ligger i linje med resultaten från Stanforduniversitetets AI Index Report 2025, som dokumenterar en dramatisk minskning av prestandaskillnaden mellan ledande amerikanska och kinesiska AI-modeller. Enligt rapporten minskade skillnaden mellan toppmodeller från USA och Kina på viktiga benchmarks från tvåsiffriga tal 2023 till nästan jämnt läge i början av 2025. På Chatbot Arena Leaderboard minskade gapet mellan de bästa amerikanska och kinesiska modellerna från 9,26 % i januari 2024 till endast 1,70 % i februari 2025.
Branschledare har uppmärksammat denna förändring. Nvidias vd Jensen Huang konstaterade i maj att "DeepSeek och [Alibabas] Qwen från Kina är bland de bästa öppen källkods-AI-modellerna som släppts fritt. De har fått genomslag i USA, Europa och bortom."
DeepSeeks framgång är särskilt anmärkningsvärd eftersom företaget började som en relativt liten startup. Modellen är tillgänglig under en generös licens, både i fullversion och i en mindre "destillerad" variant som kan köras på enklare hårdvara, vilket gör avancerade AI-funktioner mer tillgängliga för utvecklare världen över.