चीनी एआई स्टार्टअप डीपसीक अपने नवीनतम मॉडल अनुकूलन नवाचार के साथ वैश्विक आर्टिफिशियल इंटेलिजेंस परिदृश्य को लगातार बदल रहा है। 29 मई को कंपनी ने खुलासा किया कि उसके हाल ही में अपडेट किए गए R1-0528 रीजनिंग मॉडल के एक वेरिएंट का उपयोग अलीबाबा के Qwen 3 8B बेस मॉडल को डिस्टिलेशन नामक प्रक्रिया के माध्यम से बेहतर बनाने के लिए किया गया।
डिस्टिलेशन तकनीक, जिसमें एक अधिक उन्नत मॉडल से छोटे मॉडल में ज्ञान स्थानांतरित किया जाता है, ने डीपसीक को अपने R1-0528 मॉडल की रीजनिंग प्रक्रियाएं अलीबाबा के सिस्टम में स्थानांतरित करने में सक्षम बनाया। डीपसीक के अनुसार, इस प्रक्रिया के परिणामस्वरूप Qwen 3 मॉडल के प्रदर्शन में 10% से अधिक की वृद्धि दर्ज की गई।
डीपसीक ने अपनी घोषणा में कहा, "हमें विश्वास है कि DeepSeek-R1-0528 की चेन-ऑफ-थॉट अकादमिक शोध और व्यावहारिक अनुप्रयोगों, दोनों के लिए महत्वपूर्ण भूमिका निभाएगी।" कंपनी पहले भी Qwen और Meta के Llama आर्किटेक्चर पर आधारित कई डिस्टिल्ड मॉडल जारी कर चुकी है, जिनका आकार 1.5B से 70B पैरामीटर तक है।
जनवरी में अपने R1 मॉडल के प्रदर्शन के बाद से डीपसीक के एआई विकास दृष्टिकोण ने काफी ध्यान आकर्षित किया है, जब इसने OpenAI और Google के मॉडलों के बराबर प्रदर्शन बहुत कम कंप्यूटिंग लागत पर दिखाया था। कंपनी की इस सफलता ने इस धारणा को चुनौती दी है कि अत्याधुनिक एआई के लिए विशाल कंप्यूटिंग संसाधनों और निवेश की आवश्यकता होती है।
उन्नत एआई चिप्स पर अमेरिकी निर्यात प्रतिबंधों का सामना करने के बावजूद, डीपसीक ने अपने मॉडलों को कम-शक्ति, निर्यात-स्वीकृत हार्डवेयर पर कुशलतापूर्वक चलाने के लिए अनुकूलित किया है। इस रणनीति ने प्रतिस्पर्धियों को अपने हार्डवेयर पर निर्भरता पर पुनर्विचार करने के लिए मजबूर किया है और एआई क्षेत्र में बाजार की गतिशीलता को प्रभावित किया है।
नवीनतम R1-0528 अपडेट डीपसीक के मॉडल को OpenAI के o3 रीजनिंग मॉडल और Google के Gemini 2.5 Pro के प्रदर्शन के और करीब ले आता है, जिसमें रीजनिंग गहराई, इन्फरेंस क्षमताओं और हल्यूसिनेशन में उल्लेखनीय सुधार हुए हैं। कंपनी का निरंतर नवाचार और ओपन-सोर्स दृष्टिकोण एआई मॉडल विकास और तैनाती दक्षता के लिए अपेक्षाओं को नया आकार दे रहा है।