चीनी आर्टिफिशियल इंटेलिजेंस स्टार्टअप DeepSeek ने अपने ओपन-सोर्स रीजनिंग मॉडल को R1-0528 के रूप में महत्वपूर्ण रूप से अपग्रेड किया है, जिससे इसकी परफॉर्मेंस अब OpenAI के o3 और Google के Gemini 2.5 Pro जैसे इंडस्ट्री लीडर्स के करीब पहुंच गई है।
यह अपग्रेड DeepSeek की रीजनिंग क्षमताओं में बड़ा सुधार दर्शाता है, जिसमें अधिक कंप्यूटेशनल संसाधनों और एल्गोरिदमिक ऑप्टिमाइजेशन का योगदान है। बेंचमार्क टेस्ट में, मॉडल ने गणितीय रीजनिंग में उल्लेखनीय सुधार दिखाया—AIME 2025 गणित टेस्ट में इसकी सटीकता 70% से बढ़कर 87.5% हो गई। यह सुधार गहराई से रीजनिंग करने की क्षमता के कारण आया है, जहां अब मॉडल हर प्रश्न के लिए औसतन 23,000 टोकन का उपयोग करता है, जबकि पहले यह 12,000 था।
गणितीय सुधारों के अलावा, R1-0528 में कई ऐसे फीचर्स जोड़े गए हैं जो इसे डेवलपर्स के लिए और भी अनुकूल बनाते हैं। अब यह मॉडल सिस्टम प्रॉम्प्ट्स, फंक्शन कॉलिंग और JSON आउटपुट को सपोर्ट करता है, जिससे इसे एप्लिकेशनों में एकीकृत करना आसान हो गया है। इसके अलावा, इसमें 'हैलुसिनेशन' की दर में भी उल्लेखनीय कमी आई है—रीराइटिंग और समरी टास्क में यह दर 45-50% तक कम हो गई है। साथ ही, यह 'वाइब कोडिंग' के लिए बेहतर सपोर्ट देता है, जिसमें डेवलपर्स नेचुरल लैंग्वेज के जरिए कोड जेनरेट कर सकते हैं।
सीमित संसाधनों वाले यूज़र्स के लिए, DeepSeek ने DeepSeek-R1-0528-Qwen3-8B नामक एक डिस्टिल्ड वर्शन भी जारी किया है। इसे Alibaba के Qwen3 8B मॉडल को R1-0528 के रीजनिंग पैटर्न्स के साथ फाइन-ट्यून करके तैयार किया गया है। यह छोटा मॉडल एक साधारण कंज्यूमर-ग्रेड GPU पर भी चल सकता है, और कुछ गणितीय बेंचमार्क्स पर Google के Gemini 2.5 Flash से बेहतर प्रदर्शन करता है, साथ ही Microsoft के Phi 4 reasoning plus मॉडल के भी करीब पहुंच जाता है।
अपने पूर्ववर्ती की तरह, R1-0528 भी उदार MIT लाइसेंस के तहत उपलब्ध है, जिससे इसका व्यावसायिक उपयोग और कस्टमाइजेशन संभव है। प्रमुख क्लाउड प्रोवाइडर्स जैसे Amazon Web Services और Microsoft Azure अब DeepSeek के मॉडल्स को अपने ग्राहकों के लिए उपलब्ध करा रहे हैं, हालांकि डेटा प्राइवेसी सुनिश्चित करने के लिए इन्हें चीनी सर्वरों से अलग रखा जाता है।
यह रिलीज़ DeepSeek और Meta को ओपन-सोर्स AI क्षेत्र में अग्रणी बनाती है, जो OpenAI, Google, Microsoft और Anthropic के मालिकाना मॉडलों के मुकाबले कम लागत में शक्तिशाली विकल्प प्रदान कर रही हैं।