गूगल ने अपने वार्षिक I/O डेवलपर सम्मेलन में 20 मई, 2025 को Veo 3 और Imagen 4 लॉन्च करके अपनी एआई मीडिया जनरेशन क्षमताओं में महत्वपूर्ण प्रगति की है।
Veo 3, गूगल का नवीनतम वीडियो जनरेशन मॉडल, पहली बार ऑडियो जनरेशन क्षमताओं के साथ एक बड़ी छलांग का प्रतिनिधित्व करता है। यह मॉडल ऐसे वीडियो बना सकता है जिनमें ट्रैफिक की आवाज़ या पक्षियों की चहचहाहट जैसी सिंक्रनाइज़्ड बैकग्राउंड साउंड्स होती हैं, और यहां तक कि पात्रों के बीच संवाद भी सटीक लिप सिंकिंग के साथ जनरेट कर सकता है। Veo 3 वास्तविक दुनिया की भौतिकी और मानवीय भाव-भंगिमाओं की बेहतर समझ प्रदर्शित करता है, जिससे वीडियो आउटपुट अधिक यथार्थवादी और विस्तृत बनते हैं।
Veo 3 के साथ ही, गूगल ने अब तक का सबसे उन्नत इमेज जनरेशन मॉडल Imagen 4 भी पेश किया। Imagen 4 जटिल कपड़ों, पानी की बूंदों और जानवरों के बालों जैसे बारीक विवरणों को अद्भुत स्पष्टता के साथ प्रस्तुत करने में सक्षम है। यह मॉडल विभिन्न आस्पेक्ट रेशियो को सपोर्ट करता है और 2K रेज़ोल्यूशन तक की इमेज बना सकता है, जिससे ये प्रिंटिंग या प्रेजेंटेशन के लिए उपयुक्त हैं। गूगल ने Imagen 4 का एक "फास्ट वेरिएंट" भी जारी करने की योजना बनाई है, जो अपने पूर्ववर्ती की तुलना में 10 गुना तेज़ होगा और रैपिड प्रोटोटाइपिंग व क्रिएटिव वर्कफ़्लो के लिए अनुकूलित होगा।
ये शक्तिशाली एआई मॉडल Flow नामक गूगल के नए एआई-समर्थित फिल्म निर्माण टूल की नींव हैं। Flow, Veo, Imagen और Gemini की क्षमताओं को जोड़ता है ताकि कहानीकार सिनेमाई क्लिप्स और सीन बना सकें। इस टूल में सटीक कैमरा मूवमेंट के लिए Camera Controls, शॉट्स को सहजता से बढ़ाने के लिए SceneBuilder, और क्रिएटिव एलिमेंट्स को व्यवस्थित करने के लिए Asset Management जैसी सुविधाएँ हैं। Flow रचनाकारों को कई क्लिप्स में एकसमान पात्रों और दृश्यों को बनाए रखने में सक्षम बनाता है, जिससे कहानी कहने का अनुभव अधिक सुसंगत होता है।
Veo 3 फिलहाल संयुक्त राज्य अमेरिका में Google AI Ultra सब्सक्राइबर्स के लिए उपलब्ध है, जिसकी कीमत $249.99 प्रति माह है, जबकि Imagen 4 Gemini ऐप, Whisk, Vertex AI और विभिन्न Google Workspace एप्लिकेशन के माध्यम से उपलब्ध है। इन मॉडलों द्वारा जनरेट की गई सभी सामग्री में SynthID वॉटरमार्क शामिल है, ताकि पारदर्शिता बनी रहे और गलत सूचना से बचाव हो सके।
ये प्रगति गूगल की अपनी एआई क्षमताओं को अधिक उपयोगकर्ताओं तक पहुँचाने की प्रतिबद्धता को दर्शाती है। कंपनी ने यह भी घोषणा की है कि Gemini ऐप्स के अब 400 मिलियन से अधिक मासिक सक्रिय उपयोगकर्ता हैं, जो उसकी एआई तकनीकों को तेजी से अपनाए जाने को दर्शाता है।