Google DeepMind ने Gemini Diffusion नामक एक क्रांतिकारी एआई टेक्स्ट जेनरेशन तकनीक पेश की है, जो पारंपरिक ऑटोरिग्रेसिव लैंग्वेज मॉडल्स से एक बड़ा बदलाव है।
पारंपरिक मॉडल्स के विपरीत, जो एक-एक करके अनुक्रम में टेक्स्ट जनरेट करते हैं, Gemini Diffusion डिफ्यूजन तकनीक का उपयोग करता है—जो अब तक मुख्य रूप से इमेज और वीडियो जेनरेशन में प्रयुक्त होती थी—और एक पुनरावृत्त प्रक्रिया के माध्यम से यादृच्छिक शोर को सुसंगत टेक्स्ट में बदलता है। DeepMind के शोधकर्ताओं के अनुसार, यह नई तकनीक मॉडल को 2,000 टोकन प्रति सेकंड की अद्भुत गति से कंटेंट जनरेट करने में सक्षम बनाती है।
Google ने अपनी घोषणा में बताया, “ये मॉडल टेक्स्ट की सीधी भविष्यवाणी करने के बजाय, शोर को चरण-दर-चरण परिष्कृत कर आउटपुट जनरेट करना सीखते हैं। इसका अर्थ है कि वे समाधान पर बहुत तेजी से पुनरावृत्त हो सकते हैं और जेनरेशन प्रक्रिया के दौरान त्रुटियों को सुधार सकते हैं।”
यह प्रायोगिक डेमो, जो फिलहाल वेटलिस्ट के माध्यम से उपलब्ध है, दिखाता है कि यह तकनीक Google के मौजूदा मॉडलों के कोडिंग प्रदर्शन के बराबर है, साथ ही जेनरेशन समय को काफी कम कर देती है। बेंचमार्क्स में, Gemini Diffusion ने प्रोग्रामिंग कार्यों जैसे HumanEval और MBPP पर Gemini 2.0 Flash-Lite के लगभग समान परिणाम दिए हैं।
Google DeepMind के रिसर्च उपाध्यक्ष और Gemini प्रोजेक्ट के सह-प्रमुख Oriol Vinyals ने इस रिलीज को व्यक्तिगत उपलब्धि बताया, और उल्लेख किया कि डेमो इतनी तेज़ी से चला कि उसे देखने योग्य बनाने के लिए वीडियो को धीमा करना पड़ा।
साथ ही, Google ने अपने Gemini 2.5 लाइनअप में नई क्षमताएँ जोड़ी हैं। कंपनी ने Gemini 2.5 Flash में 'थिंकिंग बजट्स' लॉन्च किए हैं, जिससे डेवलपर्स को यह नियंत्रित करने की अभूतपूर्व सुविधा मिलती है कि उनका एआई कितना रीजनिंग करेगा। इस फीचर से यूज़र्स गुणवत्ता, विलंबता और लागत के बीच संतुलन बना सकते हैं, क्योंकि वे मॉडल के रीजनिंग प्रोसेस के लिए टोकन सीमा (24,576 टोकन तक) निर्धारित कर सकते हैं।
Google जल्द ही Gemini 2.5 Pro में भी 'थिंकिंग बजट्स' जोड़ रहा है, जिसकी सामान्य उपलब्धता अगले कुछ हफ्तों में होगी। इसके अतिरिक्त, कंपनी ने Gemini API में Model Context Protocol (MCP) परिभाषाओं के लिए नेटिव SDK सपोर्ट भी जोड़ा है, जिससे ओपन-सोर्स टूल्स के साथ इंटीग्रेशन और एजेंटिक एप्लिकेशन बनाना आसान हो गया है।
ये सभी प्रगति मिलकर Google के उस प्रयास को दर्शाती हैं, जिसमें वह डेवलपर्स के लिए एआई को और अधिक कुशल, नियंत्रित और सुलभ बनाना चाहता है, साथ ही उच्च प्रदर्शन मानकों को भी बनाए रखना चाहता है।