Google ने अपनी AI क्षमताओं का विस्तार करते हुए Imagen 4 लॉन्च किया है, जो अब तक का सबसे उन्नत टेक्स्ट-टू-इमेज जनरेशन मॉडल है। यह अब Gemini API और Google AI Studio के ज़रिए पेड प्रिव्यू में उपलब्ध है।
Imagen 4 पिछले वर्ज़नों की तुलना में खासतौर पर जनरेट की गई इमेजेज़ में टेक्स्ट रेंडरिंग क्वालिटी के मामले में बड़ा सुधार लाता है। इस रिलीज़ में दो वेरिएंट शामिल हैं: स्टैंडर्ड Imagen 4 मॉडल, जिसकी कीमत प्रति आउटपुट इमेज $0.04 है, और Imagen 4 Ultra, जिसकी कीमत प्रति इमेज $0.06 है और यह यूज़र इंस्ट्रक्शंस को और अधिक सटीकता से फॉलो करता है। दोनों मॉडल्स में SynthID वॉटरमार्किंग टेक्नोलॉजी है, जो मानव आंखों से अदृश्य है लेकिन AI-जनरेटेड कंटेंट की पहचान में मदद करती है।
यह रिलीज़ Google के Gemini 2.5 मॉडल परिवार के व्यापक विस्तार का हिस्सा है। कंपनी ने Gemini 2.5 Flash और Pro मॉडल्स को सफल प्रिव्यू के बाद सामान्य रूप से उपलब्ध करा दिया है, वहीं Gemini 2.5 Flash-Lite को प्रिव्यू में पेश किया गया है। Flash-Lite को Google का सबसे तेज़ और किफायती 2.5 मॉडल बताया गया है, जिसे क्लासिफिकेशन, ट्रांसलेशन और इंटेलिजेंट रूटिंग जैसे हाई-वॉल्यूम, लेटेंसी-सेंसिटिव टास्क्स के लिए ऑप्टिमाइज़ किया गया है।
किफायती होने के बावजूद, Gemini 2.5 Flash-Lite में 2.5 परिवार की मुख्य क्षमताएं बरकरार हैं, जैसे 1 मिलियन टोकन का कॉन्टेक्स्ट विंडो और Google Search इंटीग्रेशन व कोड एक्जीक्यूशन जैसे नेटिव टूल्स का सपोर्ट। जहां परिवार के अन्य मॉडल्स में थिंकिंग क्षमताएं डिफॉल्ट रूप से ऑन रहती हैं, वहीं Flash-Lite में डेवलपर्स API पैरामीटर्स के ज़रिए थिंकिंग बजट को नियंत्रित कर सकते हैं, और डिफॉल्ट रूप से थिंकिंग बंद रहती है ताकि स्पीड और लागत का अनुकूलन हो सके।
डेवलपर्स के लिए अपनी पेशकश को और बेहतर बनाते हुए, Google ने Gemini CLI भी लॉन्च किया है, जो एक ओपन-सोर्स AI एजेंट है और Gemini को सीधे टर्मिनल में लाता है। यह टूल डेवलपर्स को कमांड-लाइन इंटरफेस के ज़रिए Gemini 2.5 Pro तक पहुंच प्रदान करता है, जिससे कोडिंग, समस्या-समाधान और टास्क मैनेजमेंट आसान हो जाता है। Gemini CLI का ओपन-सोर्स होना (Apache 2.0 लाइसेंस के तहत) डेवलपर्स को कोड की जांच, सुरक्षा संबंधी पहलुओं की पुष्टि और इसके विकास में योगदान करने की सुविधा देता है।
Google की ये नवीनतम AI रिलीज़ दर्शाती हैं कि कंपनी विभिन्न मूल्य बिंदुओं और उपयोग मामलों के लिए डेवलपर्स को लगातार अधिक शक्तिशाली और लचीले टूल्स उपलब्ध कराने के लिए प्रतिबद्ध है—चाहे वह उच्च गुणवत्ता वाली इमेज जनरेशन हो, कुशल टेक्स्ट प्रोसेसिंग या टर्मिनल-आधारित AI असिस्टेंस।