menu
close

DeepSeek ने अपने R1 एआई मॉडल को किया अपग्रेड, पश्चिमी टेक दिग्गजों को दी चुनौती

चीनी एआई स्टार्टअप DeepSeek ने अपने R1 रीजनिंग मॉडल का नया अपडेट जारी किया है, जिसने इस साल की शुरुआत में कंपनी को वैश्विक पहचान दिलाई थी। R1-0528 अपडेट को कंपनी ने 'मामूली' बताया है, लेकिन इसमें कोडिंग क्षमताओं, तर्कशक्ति और लेखन कार्यों में उल्लेखनीय सुधार देखने को मिला है। यह अपडेटेड मॉडल DeepSeek की लागत-कुशल एआई विकास रणनीति को बरकरार रखते हुए OpenAI और Google के मॉडलों के प्रदर्शन को टक्कर देता है।
DeepSeek ने अपने R1 एआई मॉडल को किया अपग्रेड, पश्चिमी टेक दिग्गजों को दी चुनौती

DeepSeek, वह चीनी आर्टिफिशियल इंटेलिजेंस स्टार्टअप जिसने जनवरी में अपने क्रांतिकारी R1 मॉडल के साथ टेक शेयरों में हलचल मचा दी थी, ने चुपचाप अपने प्रमुख एआई सिस्टम का एक महत्वपूर्ण अपडेट जारी किया है।

नया वर्शन, DeepSeek-R1-0528 नाम से, 28 मई को कंपनी के WeChat ग्रुप में एक संक्षिप्त घोषणा के साथ जारी किया गया। हालांकि DeepSeek ने इसे 'मामूली परीक्षण अपडेट' बताया है, शुरुआती परीक्षणों में कई क्षेत्रों में उल्लेखनीय सुधार सामने आए हैं।

LiveCodeBench लीडरबोर्ड के अनुसार, अपडेटेड मॉडल अब कोडिंग क्षमताओं में चौथे स्थान पर है, जिसमें Pass@1 स्कोर 73.1 है। यह OpenAI के O3 और O4-Mini मॉडलों के ठीक पीछे है। यह ओपन-सोर्स मॉडल के लिए एक बड़ी उपलब्धि है, खासकर तब जब इसके विकास में पश्चिमी कंपनियों की तुलना में काफी कम संसाधनों का उपयोग हुआ है।

तकनीकी विवरण के अनुसार, R1-0528 अपने पूर्ववर्ती की तरह Mixture-of-Experts (MoE) आर्किटेक्चर पर आधारित है, जिसमें कुल लगभग 685 अरब पैरामीटर हैं, हालांकि अनुमान के दौरान केवल लगभग 37 अरब पैरामीटर सक्रिय रहते हैं। अब यह मॉडल 128K टोकन तक का विस्तारित कॉन्टेक्स्ट विंडो सपोर्ट करता है, जिससे यह बड़े दस्तावेज़ों और कोडबेस को प्रोसेस करने में सक्षम है।

यूजर्स की प्रतिक्रियाओं में तर्कशक्ति, लेखन गुणवत्ता और समस्या-समाधान क्षमताओं में सुधार की पुष्टि हुई है। डेवलपर्स का कहना है कि अब यह मॉडल जटिल कार्यों के लिए 30-60 मिनट तक विस्तृत तर्क-वितर्क कर सकता है, जो Google के मॉडलों के समान है। इस अपडेट में टेक्स्ट जनरेशन की पिछली कमियों को भी दूर किया गया है, जिससे अब अधिक स्वाभाविक और बेहतर फॉर्मेटेड कंटेंट तैयार होता है।

DeepSeek का लगातार नवाचार यह साबित करता है कि एआई को स्केल करने के लिए विशाल कंप्यूटिंग पावर और भारी निवेश की आवश्यकता नहीं है। लागत-कुशल, ओपन-सोर्स मॉडलों की सफलता ने पहले ही टेक दिग्गजों को प्रतिक्रिया देने के लिए मजबूर कर दिया है—OpenAI ने कीमतें घटाई हैं और Google ने सस्ती एक्सेस टियर पेश किए हैं। इसी बीच, चीनी प्रतिस्पर्धी जैसे अलीबाबा और टेनसेंट ने भी अपने मॉडल जारी किए हैं, जो DeepSeek की क्षमताओं से आगे निकलने का दावा करते हैं।

R1-0528 अपडेट Hugging Face पर MIT लाइसेंस के तहत उपलब्ध है, जिससे इसका व्यावसायिक उपयोग और संशोधन संभव है। इंडस्ट्री एक्सपर्ट्स को उम्मीद है कि DeepSeek आने वाले महीनों में अपना और भी व्यापक R2 मॉडल लॉन्च करेगा, जो एआई जगत में और बड़ा बदलाव ला सकता है।

Source:

Latest News