DeepSeek, chiński startup zajmujący się sztuczną inteligencją, ugruntował swoją pozycję jako poważny konkurent dla zachodniej dominacji w branży AI dzięki najnowszej aktualizacji modelu R1-0528, który obecnie osiąga wyniki zbliżone do liderów rynku, takich jak OpenAI i Google.
Ulepszony model, określany przez DeepSeek jako „niewielka aktualizacja wersji”, przynosi jednak znaczące usprawnienia w kluczowych obszarach. W zakresie rozumowania matematycznego dokładność modelu na wymagającym teście AIME 2025 wzrosła z 70% do 87,5%, co świadczy o lepszych zdolnościach rozwiązywania problemów. Postęp ten wynika z pogłębionej zdolności rozumowania modelu, który obecnie wykorzystuje około 23 000 tokenów na zapytanie, w porównaniu do 12 000 w poprzedniej wersji.
Poza matematyką, R1-0528 wykazuje również znaczący wzrost kompetencji programistycznych. W wyzwaniu programistycznym Codeforces model osiągnął ocenę około 1930 punktów, podczas gdy wcześniej było to 1530 – oznacza to poprawę o 400 punktów, odzwierciedlającą lepsze generowanie kodu i rozwiązywanie problemów. Jego wyniki na kompleksowych testach kodowania również uległy znaczącej poprawie.
Postępy modelu wpisują się w ustalenia raportu Stanford University's 2025 AI Index, który dokumentuje gwałtowne zmniejszenie różnicy wydajności między czołowymi modelami AI z USA i Chin. Według raportu, różnica między najlepszymi amerykańskimi i chińskimi modelami na głównych benchmarkach zmniejszyła się z wartości dwucyfrowych w 2023 roku do niemal pełnej równowagi na początku 2025 roku. Na liście Chatbot Arena Leaderboard różnica między czołowymi modelami z USA i Chin spadła z 9,26% w styczniu 2024 do zaledwie 1,70% w lutym 2025.
Liderzy branży zwrócili uwagę na tę zmianę. Dyrektor generalny Nvidii, Jensen Huang, przyznał w maju, że „DeepSeek oraz Qwen od [Alibaby] z Chin to jedne z najlepszych otwartoźródłowych modeli AI udostępnionych publicznie. Zyskały popularność w USA, Europie i poza nimi.”
Osiągnięcie DeepSeek jest szczególnie godne uwagi, ponieważ pochodzi od firmy, która zaczynała jako stosunkowo niewielki startup. Model dostępny jest na liberalnej licencji, zarówno w pełnej wersji, jak i w mniejszym, „destylowanym” wariancie, który może działać na mniej wydajnym sprzęcie, czyniąc zaawansowane możliwości AI bardziej dostępnymi dla programistów na całym świecie.