menu
close

DeepSeek का R1 अपग्रेड बेहतर रीजनिंग के साथ AI दिग्गजों को चुनौती देता है

चीनी AI स्टार्टअप DeepSeek ने अपने ओपन-सोर्स रीजनिंग मॉडल का नया वर्शन R1-0528 जारी किया है, जो अब OpenAI और Google जैसी कंपनियों के मालिकाना मॉडलों की बराबरी करने लगा है। इस उन्नत मॉडल ने गणितीय सटीकता में जबरदस्त सुधार दिखाया है—AIME 2025 टेस्ट में इसकी सटीकता 70% से बढ़कर 87.5% हो गई है, क्योंकि इसकी रीजनिंग क्षमता दोगुनी हो गई है। DeepSeek ने एक छोटा 8B-पैरामीटर डिस्टिल्ड वर्शन भी जारी किया है, जो एक सिंगल GPU पर भी शानदार प्रदर्शन के साथ चल सकता है।
DeepSeek का R1 अपग्रेड बेहतर रीजनिंग के साथ AI दिग्गजों को चुनौती देता है

चीनी आर्टिफिशियल इंटेलिजेंस स्टार्टअप DeepSeek ने अपने ओपन-सोर्स रीजनिंग मॉडल को R1-0528 के रूप में महत्वपूर्ण रूप से अपग्रेड किया है, जिससे इसकी परफॉर्मेंस अब OpenAI के o3 और Google के Gemini 2.5 Pro जैसे इंडस्ट्री लीडर्स के करीब पहुंच गई है।

यह अपग्रेड DeepSeek की रीजनिंग क्षमताओं में बड़ा सुधार दर्शाता है, जिसमें अधिक कंप्यूटेशनल संसाधनों और एल्गोरिदमिक ऑप्टिमाइजेशन का योगदान है। बेंचमार्क टेस्ट में, मॉडल ने गणितीय रीजनिंग में उल्लेखनीय सुधार दिखाया—AIME 2025 गणित टेस्ट में इसकी सटीकता 70% से बढ़कर 87.5% हो गई। यह सुधार गहराई से रीजनिंग करने की क्षमता के कारण आया है, जहां अब मॉडल हर प्रश्न के लिए औसतन 23,000 टोकन का उपयोग करता है, जबकि पहले यह 12,000 था।

गणितीय सुधारों के अलावा, R1-0528 में कई ऐसे फीचर्स जोड़े गए हैं जो इसे डेवलपर्स के लिए और भी अनुकूल बनाते हैं। अब यह मॉडल सिस्टम प्रॉम्प्ट्स, फंक्शन कॉलिंग और JSON आउटपुट को सपोर्ट करता है, जिससे इसे एप्लिकेशनों में एकीकृत करना आसान हो गया है। इसके अलावा, इसमें 'हैलुसिनेशन' की दर में भी उल्लेखनीय कमी आई है—रीराइटिंग और समरी टास्क में यह दर 45-50% तक कम हो गई है। साथ ही, यह 'वाइब कोडिंग' के लिए बेहतर सपोर्ट देता है, जिसमें डेवलपर्स नेचुरल लैंग्वेज के जरिए कोड जेनरेट कर सकते हैं।

सीमित संसाधनों वाले यूज़र्स के लिए, DeepSeek ने DeepSeek-R1-0528-Qwen3-8B नामक एक डिस्टिल्ड वर्शन भी जारी किया है। इसे Alibaba के Qwen3 8B मॉडल को R1-0528 के रीजनिंग पैटर्न्स के साथ फाइन-ट्यून करके तैयार किया गया है। यह छोटा मॉडल एक साधारण कंज्यूमर-ग्रेड GPU पर भी चल सकता है, और कुछ गणितीय बेंचमार्क्स पर Google के Gemini 2.5 Flash से बेहतर प्रदर्शन करता है, साथ ही Microsoft के Phi 4 reasoning plus मॉडल के भी करीब पहुंच जाता है।

अपने पूर्ववर्ती की तरह, R1-0528 भी उदार MIT लाइसेंस के तहत उपलब्ध है, जिससे इसका व्यावसायिक उपयोग और कस्टमाइजेशन संभव है। प्रमुख क्लाउड प्रोवाइडर्स जैसे Amazon Web Services और Microsoft Azure अब DeepSeek के मॉडल्स को अपने ग्राहकों के लिए उपलब्ध करा रहे हैं, हालांकि डेटा प्राइवेसी सुनिश्चित करने के लिए इन्हें चीनी सर्वरों से अलग रखा जाता है।

यह रिलीज़ DeepSeek और Meta को ओपन-सोर्स AI क्षेत्र में अग्रणी बनाती है, जो OpenAI, Google, Microsoft और Anthropic के मालिकाना मॉडलों के मुकाबले कम लागत में शक्तिशाली विकल्प प्रदान कर रही हैं।

Source:

Latest News