menu
close

DeepSeek aktualizuje model AI R1, rzucając wyzwanie zachodnim gigantom technologicznym

Chiński startup AI DeepSeek wypuścił aktualizację swojego modelu rozumowania R1, który na początku roku przyniósł firmie światową rozpoznawalność. Choć aktualizacja R1-0528 została określona przez firmę jako „drobna”, wykazuje znaczące postępy w zakresie programowania, głębokości rozumowania oraz zadań pisarskich. Zaktualizowany model zachowuje efektywność kosztową DeepSeek, dorównując wydajnością modelom OpenAI i Google.
DeepSeek aktualizuje model AI R1, rzucając wyzwanie zachodnim gigantom technologicznym

DeepSeek, chiński startup zajmujący się sztuczną inteligencją, który w styczniu wywołał spadki akcji technologicznych swoim przełomowym modelem R1, po cichu wprowadził znaczącą aktualizację swojego flagowego systemu AI.

Nowa wersja, nazwana DeepSeek-R1-0528, została udostępniona 28 maja bez większego rozgłosu, poprzez krótkie ogłoszenie w firmowej grupie na WeChat. Mimo że DeepSeek określa ją jako „drobne próbne ulepszenie”, wczesne testy wykazują istotne postępy w wielu obszarach.

Według rankingu LiveCodeBench, zaktualizowany model zajmuje obecnie czwarte miejsce pod względem możliwości programistycznych, osiągając wynik Pass@1 na poziomie 73,1, co plasuje go tuż za modelami O3 i O4-Mini od OpenAI. To ogromny skok dla modelu open source, zwłaszcza stworzonego przy znacznie mniejszych zasobach niż jego zachodni konkurenci.

Specyfikacja techniczna wskazuje, że R1-0528 zachowuje architekturę Mixture-of-Experts (MoE) znaną z poprzedniej wersji, z około 685 miliardami parametrów ogółem, z czego podczas wnioskowania aktywnych jest około 37 miliardów. Model obsługuje teraz rozszerzone okno kontekstowe do 128 tys. tokenów, co pozwala mu przetwarzać znacznie większe dokumenty i bazy kodu.

Opinie użytkowników podkreślają poprawę głębokości rozumowania, jakości pisania oraz zdolności rozwiązywania problemów. Programiści zgłaszają, że model potrafi teraz prowadzić rozbudowane sesje rozumowania trwające 30–60 minut przy złożonych zadaniach, podobnie jak modele Google. Aktualizacja eliminuje również wcześniejsze niedoskonałości w generowaniu tekstu, zapewniając bardziej naturalne i lepiej sformatowane treści.

Ciągła innowacyjność DeepSeek podważa przekonanie, że skalowanie AI wymaga ogromnej mocy obliczeniowej i inwestycji. Sukces firmy w tworzeniu efektywnych kosztowo, otwartych modeli już wymusił reakcje gigantów technologicznych – OpenAI obniżyło ceny, a Google wprowadziło tańsze warianty dostępu. Tymczasem chińscy konkurenci, tacy jak Alibaba i Tencent, wypuścili własne modele, deklarując przewagę nad możliwościami DeepSeek.

Aktualizacja R1-0528 jest dostępna na platformie Hugging Face na licencji MIT, umożliwiającej komercyjne wykorzystanie i modyfikacje. Branżowi obserwatorzy spodziewają się, że w najbliższych miesiącach DeepSeek wypuści bardziej zaawansowany model R2, co może jeszcze mocniej wpłynąć na rynek AI.

Source:

Latest News