Google का Gemini Diffusion: एआई टेक्स्ट जेनरेशन में क्रांति

Google ने Gemini Diffusion नामक एक क्रांतिकारी टेक्स्ट जेनरेशन मॉडल पेश किया है, जो यादृच्छिक शोर को सुसंगत टेक्स्ट में बदलने की क्षमता रखता है और पिछले मॉडलों की तुलना में पाँच गुना तेज गति से काम करता है। यह प्रायोगिक मॉडल डिफ्यूजन तकनीक का उपयोग करता है—जो आमतौर पर इमेज जेनरेशन में इस्तेमाल होती थी—और 2,000 टोकन प्रति सेकंड तक उत्पन्न कर सकता है, साथ ही मौजूदा मॉडलों के बराबर कोडिंग प्रदर्शन भी देता है। Google ने अपने Gemini 2.5 लाइनअप में 'थिंकिंग बजट्स' भी जोड़े हैं, जिससे डेवलपर्स को रीजनिंग क्षमताओं और लागत पर सटीक नियंत्रण मिलता है।

Google DeepMind ने Gemini Diffusion नामक एक क्रांतिकारी एआई टेक्स्ट जेनरेशन तकनीक पेश की है, जो पारंपरिक ऑटोरिग्रेसिव लैंग्वेज मॉडल्स से एक बड़ा बदलाव है।

पारंपरिक मॉडल्स के विपरीत, जो एक-एक करके अनुक्रम में टेक्स्ट जनरेट करते हैं, Gemini Diffusion डिफ्यूजन तकनीक का उपयोग करता है—जो अब तक मुख्य रूप से इमेज और वीडियो जेनरेशन में प्रयुक्त होती थी—और एक पुनरावृत्त प्रक्रिया के माध्यम से यादृच्छिक शोर को सुसंगत टेक्स्ट में बदलता है। DeepMind के शोधकर्ताओं के अनुसार, यह नई तकनीक मॉडल को 2,000 टोकन प्रति सेकंड की अद्भुत गति से कंटेंट जनरेट करने में सक्षम बनाती है।

Google ने अपनी घोषणा में बताया, “ये मॉडल टेक्स्ट की सीधी भविष्यवाणी करने के बजाय, शोर को चरण-दर-चरण परिष्कृत कर आउटपुट जनरेट करना सीखते हैं। इसका अर्थ है कि वे समाधान पर बहुत तेजी से पुनरावृत्त हो सकते हैं और जेनरेशन प्रक्रिया के दौरान त्रुटियों को सुधार सकते हैं।”

यह प्रायोगिक डेमो, जो फिलहाल वेटलिस्ट के माध्यम से उपलब्ध है, दिखाता है कि यह तकनीक Google के मौजूदा मॉडलों के कोडिंग प्रदर्शन के बराबर है, साथ ही जेनरेशन समय को काफी कम कर देती है। बेंचमार्क्स में, Gemini Diffusion ने प्रोग्रामिंग कार्यों जैसे HumanEval और MBPP पर Gemini 2.0 Flash-Lite के लगभग समान परिणाम दिए हैं।

Google DeepMind के रिसर्च उपाध्यक्ष और Gemini प्रोजेक्ट के सह-प्रमुख Oriol Vinyals ने इस रिलीज को व्यक्तिगत उपलब्धि बताया, और उल्लेख किया कि डेमो इतनी तेज़ी से चला कि उसे देखने योग्य बनाने के लिए वीडियो को धीमा करना पड़ा।

साथ ही, Google ने अपने Gemini 2.5 लाइनअप में नई क्षमताएँ जोड़ी हैं। कंपनी ने Gemini 2.5 Flash में 'थिंकिंग बजट्स' लॉन्च किए हैं, जिससे डेवलपर्स को यह नियंत्रित करने की अभूतपूर्व सुविधा मिलती है कि उनका एआई कितना रीजनिंग करेगा। इस फीचर से यूज़र्स गुणवत्ता, विलंबता और लागत के बीच संतुलन बना सकते हैं, क्योंकि वे मॉडल के रीजनिंग प्रोसेस के लिए टोकन सीमा (24,576 टोकन तक) निर्धारित कर सकते हैं।

Google जल्द ही Gemini 2.5 Pro में भी 'थिंकिंग बजट्स' जोड़ रहा है, जिसकी सामान्य उपलब्धता अगले कुछ हफ्तों में होगी। इसके अतिरिक्त, कंपनी ने Gemini API में Model Context Protocol (MCP) परिभाषाओं के लिए नेटिव SDK सपोर्ट भी जोड़ा है, जिससे ओपन-सोर्स टूल्स के साथ इंटीग्रेशन और एजेंटिक एप्लिकेशन बनाना आसान हो गया है।

ये सभी प्रगति मिलकर Google के उस प्रयास को दर्शाती हैं, जिसमें वह डेवलपर्स के लिए एआई को और अधिक कुशल, नियंत्रित और सुलभ बनाना चाहता है, साथ ही उच्च प्रदर्शन मानकों को भी बनाए रखना चाहता है।

Source:

Google का Gemini Diffusion: एआई टेक्स्ट जेनरेशन में क्रांति

Latest News

SEC ने भ्रामक AI दावों पर सख्ती बढ़ाई

न्यायाधीश ने Google प्रतिस्पर्धा-विरोधी उपायों में AI के प्रभाव पर विचार किया

2025 उत्कृष्टता पुरस्कारों में शीर्ष एआई नवप्रवर्तकों को सम्मानित किया गया

WildFusion: रोबोट्स को बाहरी नेविगेशन के लिए मानव-जैसी संवेदनाएँ देता है

फिंगरटिप फीडबैक: नई हैप्टिक टूल्स से औद्योगिक रोबोट सुरक्षा में क्रांति

VentureBeat ने मई 2025 में प्रमुख AI प्रगति को किया उजागर

एआई ब्रेन से चीन की ह्यूमनॉइड रोबोट क्रांति को मिल रही ताकत

रोबोट्स ने बिना मानव पर्यवेक्षण के सीखी सामाजिक कुशलताएँ

NYT ने अमेज़न के साथ Alexa के लिए पहला AI कंटेंट डील किया

Grammarly ने $1 अरब जुटाए, लेखन टूल से AI प्लेटफ़ॉर्म में बदलने की तैयारी

Google का Gemini Diffusion: एआई टेक्स्ट जेनरेशन में क्रांति

Related Articles

न्यायाधीश ने Google प्रतिस्पर्धा-विरोधी उपायों में AI के प्रभाव पर विचार किया

VentureBeat ने मई 2025 में प्रमुख AI प्रगति को किया उजागर

DeepSeek ने अपने R1 एआई मॉडल को किया अपग्रेड, पश्चिमी टेक दिग्गजों को दी चुनौती

Google Beam: क्रांतिकारी 3D वीडियो कॉलिंग 2025 में आ रही है

Google ने I/O 2025 में Gemini 2.5 Deep Think का किया अनावरण

Latest News

SEC ने भ्रामक AI दावों पर सख्ती बढ़ाई

न्यायाधीश ने Google प्रतिस्पर्धा-विरोधी उपायों में AI के प्रभाव पर विचार किया

2025 उत्कृष्टता पुरस्कारों में शीर्ष एआई नवप्रवर्तकों को सम्मानित किया गया

WildFusion: रोबोट्स को बाहरी नेविगेशन के लिए मानव-जैसी संवेदनाएँ देता है

फिंगरटिप फीडबैक: नई हैप्टिक टूल्स से औद्योगिक रोबोट सुरक्षा में क्रांति

VentureBeat ने मई 2025 में प्रमुख AI प्रगति को किया उजागर

एआई ब्रेन से चीन की ह्यूमनॉइड रोबोट क्रांति को मिल रही ताकत

रोबोट्स ने बिना मानव पर्यवेक्षण के सीखी सामाजिक कुशलताएँ

NYT ने अमेज़न के साथ Alexa के लिए पहला AI कंटेंट डील किया

Grammarly ने $1 अरब जुटाए, लेखन टूल से AI प्लेटफ़ॉर्म में बदलने की तैयारी