menu
close

Google का Gemini Diffusion: एआई टेक्स्ट जेनरेशन में क्रांति

Google ने Gemini Diffusion नामक एक क्रांतिकारी टेक्स्ट जेनरेशन मॉडल पेश किया है, जो यादृच्छिक शोर को सुसंगत टेक्स्ट में बदलने की क्षमता रखता है और पिछले मॉडलों की तुलना में पाँच गुना तेज गति से काम करता है। यह प्रायोगिक मॉडल डिफ्यूजन तकनीक का उपयोग करता है—जो आमतौर पर इमेज जेनरेशन में इस्तेमाल होती थी—और 2,000 टोकन प्रति सेकंड तक उत्पन्न कर सकता है, साथ ही मौजूदा मॉडलों के बराबर कोडिंग प्रदर्शन भी देता है। Google ने अपने Gemini 2.5 लाइनअप में 'थिंकिंग बजट्स' भी जोड़े हैं, जिससे डेवलपर्स को रीजनिंग क्षमताओं और लागत पर सटीक नियंत्रण मिलता है।
Google का Gemini Diffusion: एआई टेक्स्ट जेनरेशन में क्रांति

Google DeepMind ने Gemini Diffusion नामक एक क्रांतिकारी एआई टेक्स्ट जेनरेशन तकनीक पेश की है, जो पारंपरिक ऑटोरिग्रेसिव लैंग्वेज मॉडल्स से एक बड़ा बदलाव है।

पारंपरिक मॉडल्स के विपरीत, जो एक-एक करके अनुक्रम में टेक्स्ट जनरेट करते हैं, Gemini Diffusion डिफ्यूजन तकनीक का उपयोग करता है—जो अब तक मुख्य रूप से इमेज और वीडियो जेनरेशन में प्रयुक्त होती थी—और एक पुनरावृत्त प्रक्रिया के माध्यम से यादृच्छिक शोर को सुसंगत टेक्स्ट में बदलता है। DeepMind के शोधकर्ताओं के अनुसार, यह नई तकनीक मॉडल को 2,000 टोकन प्रति सेकंड की अद्भुत गति से कंटेंट जनरेट करने में सक्षम बनाती है।

Google ने अपनी घोषणा में बताया, “ये मॉडल टेक्स्ट की सीधी भविष्यवाणी करने के बजाय, शोर को चरण-दर-चरण परिष्कृत कर आउटपुट जनरेट करना सीखते हैं। इसका अर्थ है कि वे समाधान पर बहुत तेजी से पुनरावृत्त हो सकते हैं और जेनरेशन प्रक्रिया के दौरान त्रुटियों को सुधार सकते हैं।”

यह प्रायोगिक डेमो, जो फिलहाल वेटलिस्ट के माध्यम से उपलब्ध है, दिखाता है कि यह तकनीक Google के मौजूदा मॉडलों के कोडिंग प्रदर्शन के बराबर है, साथ ही जेनरेशन समय को काफी कम कर देती है। बेंचमार्क्स में, Gemini Diffusion ने प्रोग्रामिंग कार्यों जैसे HumanEval और MBPP पर Gemini 2.0 Flash-Lite के लगभग समान परिणाम दिए हैं।

Google DeepMind के रिसर्च उपाध्यक्ष और Gemini प्रोजेक्ट के सह-प्रमुख Oriol Vinyals ने इस रिलीज को व्यक्तिगत उपलब्धि बताया, और उल्लेख किया कि डेमो इतनी तेज़ी से चला कि उसे देखने योग्य बनाने के लिए वीडियो को धीमा करना पड़ा।

साथ ही, Google ने अपने Gemini 2.5 लाइनअप में नई क्षमताएँ जोड़ी हैं। कंपनी ने Gemini 2.5 Flash में 'थिंकिंग बजट्स' लॉन्च किए हैं, जिससे डेवलपर्स को यह नियंत्रित करने की अभूतपूर्व सुविधा मिलती है कि उनका एआई कितना रीजनिंग करेगा। इस फीचर से यूज़र्स गुणवत्ता, विलंबता और लागत के बीच संतुलन बना सकते हैं, क्योंकि वे मॉडल के रीजनिंग प्रोसेस के लिए टोकन सीमा (24,576 टोकन तक) निर्धारित कर सकते हैं।

Google जल्द ही Gemini 2.5 Pro में भी 'थिंकिंग बजट्स' जोड़ रहा है, जिसकी सामान्य उपलब्धता अगले कुछ हफ्तों में होगी। इसके अतिरिक्त, कंपनी ने Gemini API में Model Context Protocol (MCP) परिभाषाओं के लिए नेटिव SDK सपोर्ट भी जोड़ा है, जिससे ओपन-सोर्स टूल्स के साथ इंटीग्रेशन और एजेंटिक एप्लिकेशन बनाना आसान हो गया है।

ये सभी प्रगति मिलकर Google के उस प्रयास को दर्शाती हैं, जिसमें वह डेवलपर्स के लिए एआई को और अधिक कुशल, नियंत्रित और सुलभ बनाना चाहता है, साथ ही उच्च प्रदर्शन मानकों को भी बनाए रखना चाहता है।

Source:

Latest News