DeepSeek, kineski AI startup, pozicionirao se kao ozbiljan izazivač zapadnoj dominaciji u području umjetne inteligencije zahvaljujući najnovijoj nadogradnji modela R1-0528, koji sada postiže rezultate bliske industrijskim liderima poput OpenAI-a i Googlea.
Iako DeepSeek ovu nadogradnju opisuje kao "manju verzijsku nadogradnju", model donosi značajna poboljšanja u ključnim sposobnostima. U matematičkom zaključivanju, točnost modela na zahtjevnom AIME 2025 testu skočila je s 70% na 87,5%, što pokazuje napredak u rješavanju složenih problema. Ovo poboljšanje rezultat je veće dubine zaključivanja modela, koji sada koristi oko 23.000 tokena po upitu, u odnosu na 12.000 u prethodnoj verziji.
Osim matematike, R1-0528 bilježi i značajan napredak u programerskim vještinama. Na Codeforces programerskom izazovu model je ostvario ocjenu od približno 1930, što je 400 bodova više u odnosu na prethodnih 1530—što odražava napredak u generiranju koda i rješavanju zadataka. Također, performanse na sveobuhvatnim testovima programiranja znatno su poboljšane.
Napredak modela u skladu je s nalazima izvješća Stanfordova AI Indexa za 2025., koje bilježi dramatično smanjenje jaza u performansama između vodećih američkih i kineskih AI modela. Prema izvješću, razlika između najboljih američkih i kineskih modela na glavnim testovima smanjila se s dvoznamenkastih vrijednosti u 2023. na gotovo izjednačenje početkom 2025. Na Chatbot Arena Leaderboardu, razlika između vodećih američkih i kineskih modela pala je s 9,26% u siječnju 2024. na samo 1,70% u veljači 2025.
Na ovaj pomak reagirali su i vodeći ljudi iz industrije. Izvršni direktor Nvidije Jensen Huang priznao je u svibnju da su "DeepSeek i [Alibabin] Qwen iz Kine među najboljim otvorenim AI modelima koji su slobodno dostupni. Stekli su popularnost u SAD-u, Europi i šire."
Posebno je značajno što je DeepSeek do ovog uspjeha došao kao relativno mali startup. Model je dostupan pod permisivnom licencom, a osim pune verzije postoji i manja, "destilirana" varijanta koja može raditi na slabijem hardveru, čime se napredne AI mogućnosti čine dostupnijima razvojnim inženjerima diljem svijeta.