DeepSeek, chiński startup zajmujący się sztuczną inteligencją, który w styczniu wywołał spadki akcji technologicznych swoim przełomowym modelem R1, po cichu wprowadził znaczącą aktualizację swojego flagowego systemu AI.
Nowa wersja, nazwana DeepSeek-R1-0528, została udostępniona 28 maja bez większego rozgłosu, poprzez krótkie ogłoszenie w firmowej grupie na WeChat. Mimo że DeepSeek określa ją jako „drobne próbne ulepszenie”, wczesne testy wykazują istotne postępy w wielu obszarach.
Według rankingu LiveCodeBench, zaktualizowany model zajmuje obecnie czwarte miejsce pod względem możliwości programistycznych, osiągając wynik Pass@1 na poziomie 73,1, co plasuje go tuż za modelami O3 i O4-Mini od OpenAI. To ogromny skok dla modelu open source, zwłaszcza stworzonego przy znacznie mniejszych zasobach niż jego zachodni konkurenci.
Specyfikacja techniczna wskazuje, że R1-0528 zachowuje architekturę Mixture-of-Experts (MoE) znaną z poprzedniej wersji, z około 685 miliardami parametrów ogółem, z czego podczas wnioskowania aktywnych jest około 37 miliardów. Model obsługuje teraz rozszerzone okno kontekstowe do 128 tys. tokenów, co pozwala mu przetwarzać znacznie większe dokumenty i bazy kodu.
Opinie użytkowników podkreślają poprawę głębokości rozumowania, jakości pisania oraz zdolności rozwiązywania problemów. Programiści zgłaszają, że model potrafi teraz prowadzić rozbudowane sesje rozumowania trwające 30–60 minut przy złożonych zadaniach, podobnie jak modele Google. Aktualizacja eliminuje również wcześniejsze niedoskonałości w generowaniu tekstu, zapewniając bardziej naturalne i lepiej sformatowane treści.
Ciągła innowacyjność DeepSeek podważa przekonanie, że skalowanie AI wymaga ogromnej mocy obliczeniowej i inwestycji. Sukces firmy w tworzeniu efektywnych kosztowo, otwartych modeli już wymusił reakcje gigantów technologicznych – OpenAI obniżyło ceny, a Google wprowadziło tańsze warianty dostępu. Tymczasem chińscy konkurenci, tacy jak Alibaba i Tencent, wypuścili własne modele, deklarując przewagę nad możliwościami DeepSeek.
Aktualizacja R1-0528 jest dostępna na platformie Hugging Face na licencji MIT, umożliwiającej komercyjne wykorzystanie i modyfikacje. Branżowi obserwatorzy spodziewają się, że w najbliższych miesiącach DeepSeek wypuści bardziej zaawansowany model R2, co może jeszcze mocniej wpłynąć na rynek AI.