DeepSeek, un startup chinez de inteligență artificială, s-a impus ca un concurent de temut pentru dominația occidentală în AI odată cu cea mai recentă actualizare a modelului său R1-0528, care atinge acum niveluri de performanță apropiate de liderii industriei OpenAI și Google.
Modelul îmbunătățit, descris de DeepSeek drept o „actualizare minoră de versiune”, aduce totuși îmbunătățiri substanțiale în domenii cheie. În raționamentul matematic, acuratețea modelului la testul exigent AIME 2025 a crescut de la 70% la 87,5%, demonstrând abilități sporite de rezolvare a problemelor. Acest progres se datorează adâncimii sporite de raționament a modelului, care utilizează acum aproximativ 23.000 de tokenuri per interogare, comparativ cu 12.000 în versiunea anterioară.
Dincolo de matematică, R1-0528 înregistrează progrese semnificative și la capitolul programare. La provocarea de programare Codeforces, modelul a obținut un scor de aproximativ 1930, față de 1530 anterior—o creștere de 400 de puncte ce reflectă o capacitate superioară de generare de cod și rezolvare de probleme. Performanțele sale la testele complexe de programare s-au îmbunătățit, de asemenea, considerabil.
Progresul modelului este în concordanță cu concluziile Indexului AI 2025 al Universității Stanford, care documentează o reducere dramatică a diferenței de performanță dintre modelele de AI de top din SUA și China. Potrivit raportului, diferența dintre modelele americane și chineze pe principalele benchmark-uri a scăzut de la două cifre în 2023 la aproape paritate la începutul anului 2025. Pe Chatbot Arena Leaderboard, diferența dintre modelele de top din SUA și China a scăzut de la 9,26% în ianuarie 2024 la doar 1,70% în februarie 2025.
Liderii industriei au remarcat această schimbare. CEO-ul Nvidia, Jensen Huang, a recunoscut în luna mai că „DeepSeek și Qwen [de la Alibaba] din China se numără printre cele mai bune modele AI open-source lansate gratuit. Acestea au câștigat popularitate în SUA, Europa și nu numai.”
Realizarea DeepSeek este cu atât mai remarcabilă cu cât provine de la o companie care a pornit ca un startup relativ mic. Modelul este disponibil sub o licență permisivă, atât în versiunea completă, cât și într-o variantă „distilată” mai mică, ce poate rula pe hardware mai puțin performant, făcând astfel capabilitățile avansate de AI mai accesibile dezvoltatorilor din întreaga lume.