DeepSeek, een Chinese AI-startup, heeft zich met de nieuwste update van het R1-0528-model gepositioneerd als een geduchte uitdager van de Westerse AI-dominantie. Het model presteert inmiddels op een niveau dat dicht in de buurt komt van marktleiders als OpenAI en Google.
Hoewel DeepSeek de upgrade omschrijft als een 'kleine versie-update', zijn de verbeteringen op belangrijke vlakken aanzienlijk. Op het gebied van wiskundig redeneren steeg de nauwkeurigheid op de uitdagende AIME 2025-test van 70% naar 87,5%, wat duidt op sterk verbeterde probleemoplossende vaardigheden. Deze vooruitgang is te danken aan een diepgaandere redeneercapaciteit van het model, dat nu ongeveer 23.000 tokens per vraag verwerkt, tegenover 12.000 in de vorige versie.
Ook op het gebied van programmeren boekt de R1-0528 aanzienlijke winst. Op de Codeforces-programmeerwedstrijd behaalde het model een rating van circa 1930, een stijging van 400 punten ten opzichte van de eerdere 1530. Dit wijst op betere codegeneratie en probleemoplossing. De prestaties op uitgebreide programmeertests zijn eveneens sterk verbeterd.
De vooruitgang van het model sluit aan bij de bevindingen uit het AI Index Report 2025 van Stanford University, waarin wordt vastgesteld dat het prestatieverschil tussen de beste Amerikaanse en Chinese AI-modellen drastisch is verkleind. Volgens het rapport daalde het verschil op belangrijke benchmarks van dubbele cijfers in 2023 tot vrijwel gelijkheid begin 2025. Op het Chatbot Arena Leaderboard nam het verschil tussen de topmodellen uit de VS en China af van 9,26% in januari 2024 tot slechts 1,70% in februari 2025.
De industrie erkent deze verschuiving. Nvidia-CEO Jensen Huang stelde in mei: "DeepSeek en [Alibaba's] Qwen uit China behoren tot de beste open-source AI-modellen die vrij beschikbaar zijn. Ze winnen aan populariteit in de VS, Europa en daarbuiten."
De prestatie van DeepSeek is des te opmerkelijker omdat het bedrijf als relatief kleine startup begon. Het model is beschikbaar onder een permissieve licentie, zowel in een volledige versie als in een kleinere 'gedistilleerde' variant die op minder krachtige hardware draait. Hierdoor worden geavanceerde AI-mogelijkheden wereldwijd toegankelijker voor ontwikkelaars.