menu
close

Google ने पेश किया Imagen 4 और Gemini 2.5 लाइनअप का विस्तार किया

Google ने अपना अब तक का सबसे उन्नत टेक्स्ट-टू-इमेज मॉडल Imagen 4 लॉन्च किया है, जो अब Gemini API और Google AI Studio के ज़रिए पेड प्रिव्यू में उपलब्ध है। इस लॉन्च के साथ ही Gemini 2.5 Flash और Pro मॉडल्स की सामान्य उपलब्धता की घोषणा की गई है, साथ ही Gemini 2.5 Flash-Lite भी पेश किया गया है, जो 2.5 परिवार का सबसे तेज़ और किफायती मॉडल है। डेवलपर्स अब नए ओपन-सोर्स Gemini CLI के माध्यम से सीधे टर्मिनल में भी Gemini का उपयोग कर सकते हैं।
Google ने पेश किया Imagen 4 और Gemini 2.5 लाइनअप का विस्तार किया

Google ने अपनी AI क्षमताओं का विस्तार करते हुए Imagen 4 लॉन्च किया है, जो अब तक का सबसे उन्नत टेक्स्ट-टू-इमेज जनरेशन मॉडल है। यह अब Gemini API और Google AI Studio के ज़रिए पेड प्रिव्यू में उपलब्ध है।

Imagen 4 पिछले वर्ज़नों की तुलना में खासतौर पर जनरेट की गई इमेजेज़ में टेक्स्ट रेंडरिंग क्वालिटी के मामले में बड़ा सुधार लाता है। इस रिलीज़ में दो वेरिएंट शामिल हैं: स्टैंडर्ड Imagen 4 मॉडल, जिसकी कीमत प्रति आउटपुट इमेज $0.04 है, और Imagen 4 Ultra, जिसकी कीमत प्रति इमेज $0.06 है और यह यूज़र इंस्ट्रक्शंस को और अधिक सटीकता से फॉलो करता है। दोनों मॉडल्स में SynthID वॉटरमार्किंग टेक्नोलॉजी है, जो मानव आंखों से अदृश्य है लेकिन AI-जनरेटेड कंटेंट की पहचान में मदद करती है।

यह रिलीज़ Google के Gemini 2.5 मॉडल परिवार के व्यापक विस्तार का हिस्सा है। कंपनी ने Gemini 2.5 Flash और Pro मॉडल्स को सफल प्रिव्यू के बाद सामान्य रूप से उपलब्ध करा दिया है, वहीं Gemini 2.5 Flash-Lite को प्रिव्यू में पेश किया गया है। Flash-Lite को Google का सबसे तेज़ और किफायती 2.5 मॉडल बताया गया है, जिसे क्लासिफिकेशन, ट्रांसलेशन और इंटेलिजेंट रूटिंग जैसे हाई-वॉल्यूम, लेटेंसी-सेंसिटिव टास्क्स के लिए ऑप्टिमाइज़ किया गया है।

किफायती होने के बावजूद, Gemini 2.5 Flash-Lite में 2.5 परिवार की मुख्य क्षमताएं बरकरार हैं, जैसे 1 मिलियन टोकन का कॉन्टेक्स्ट विंडो और Google Search इंटीग्रेशन व कोड एक्जीक्यूशन जैसे नेटिव टूल्स का सपोर्ट। जहां परिवार के अन्य मॉडल्स में थिंकिंग क्षमताएं डिफॉल्ट रूप से ऑन रहती हैं, वहीं Flash-Lite में डेवलपर्स API पैरामीटर्स के ज़रिए थिंकिंग बजट को नियंत्रित कर सकते हैं, और डिफॉल्ट रूप से थिंकिंग बंद रहती है ताकि स्पीड और लागत का अनुकूलन हो सके।

डेवलपर्स के लिए अपनी पेशकश को और बेहतर बनाते हुए, Google ने Gemini CLI भी लॉन्च किया है, जो एक ओपन-सोर्स AI एजेंट है और Gemini को सीधे टर्मिनल में लाता है। यह टूल डेवलपर्स को कमांड-लाइन इंटरफेस के ज़रिए Gemini 2.5 Pro तक पहुंच प्रदान करता है, जिससे कोडिंग, समस्या-समाधान और टास्क मैनेजमेंट आसान हो जाता है। Gemini CLI का ओपन-सोर्स होना (Apache 2.0 लाइसेंस के तहत) डेवलपर्स को कोड की जांच, सुरक्षा संबंधी पहलुओं की पुष्टि और इसके विकास में योगदान करने की सुविधा देता है।

Google की ये नवीनतम AI रिलीज़ दर्शाती हैं कि कंपनी विभिन्न मूल्य बिंदुओं और उपयोग मामलों के लिए डेवलपर्स को लगातार अधिक शक्तिशाली और लचीले टूल्स उपलब्ध कराने के लिए प्रतिबद्ध है—चाहे वह उच्च गुणवत्ता वाली इमेज जनरेशन हो, कुशल टेक्स्ट प्रोसेसिंग या टर्मिनल-आधारित AI असिस्टेंस।

Source:

Latest News