Google ने एआई वीडियो जनरेशन को नई ऊंचाइयों पर पहुंचा दिया है, Veo 3 के लॉन्च के साथ। यह एक क्रांतिकारी मॉडल है जो पहली बार एआई-निर्मित वीडियो में ऑडियो क्षमताएं जोड़ता है।
मई में आयोजित Google I/O 2025 में पेश किया गया Veo 3, पिछले एआई वीडियो जनरेटर की तुलना में एक बड़ा कदम है, क्योंकि इसमें सिंक्रोनाइज़्ड संवाद, परिवेशी ध्वनियां और बैकग्राउंड म्यूजिक सीधे जेनरेटेड क्लिप्स में शामिल किए जा सकते हैं। Google DeepMind के सीईओ डेमिस हासाबिस ने घोषणा के दौरान कहा, "पहली बार, हम वीडियो जनरेशन के मूक युग से बाहर आ रहे हैं।"
यह तकनीक यथार्थवादी वीडियो बनाने में माहिर है, जिसमें सटीक भौतिकी, सटीक लिप-सिंकिंग और प्राकृतिक मूवमेंट शामिल हैं। यूज़र्स केवल टेक्स्ट डिस्क्रिप्शन या इमेज रेफरेंस देकर वीडियो बना सकते हैं, और एआई खुद-ब-खुद दृश्य सामग्री के अनुसार उपयुक्त ऑडियो जोड़ देता है। यह क्षमता Veo 3 को OpenAI के Sora जैसे प्रतिस्पर्धियों से अलग बनाती है, जिसमें अभी ऑडियो जनरेशन की सुविधा नहीं है।
Veo 3 के साथ-साथ, Google ने अपने लोकप्रिय Veo 2 मॉडल को भी कई शक्तिशाली नए फीचर्स के साथ अपडेट किया है। इनमें रेफरेंस-पावर्ड वीडियो (जिससे किरदार और ऑब्जेक्ट्स लगातार बने रहते हैं), सिनेमैटिक मूवमेंट के लिए एडवांस्ड कैमरा कंट्रोल्स, आउटपेंटिंग (जिससे वीडियो फ्रेम्स को उनकी सीमाओं से बाहर तक बढ़ाया जा सकता है), और इंटेलिजेंट ऑब्जेक्ट जोड़ने/हटाने की क्षमता शामिल है।
इन टूल्स की क्रिएटिव संभावनाओं को दिखाने के लिए, Google ने Flow नामक एक नया एआई फिल्ममेकिंग प्लेटफॉर्म भी पेश किया है, जो Veo, Imagen और Gemini मॉडल्स को जोड़ता है। कई फिल्ममेकर्स ने पहले ही इस तकनीक का उपयोग करके पेशेवर गुणवत्ता वाली शॉर्ट फिल्में बनाई हैं, जिनमें हेनरी डॉब्रेज़ की भावनात्मक साइ-फाई कहानी "Kitsune" और जुनी लाउ की पहचान पर आधारित "Dear Stranger" शामिल हैं।
Veo 3 फिलहाल अमेरिका में Google के $249.99 प्रति माह वाले AI Ultra प्लान के Gemini ऐप के माध्यम से, और एंटरप्राइज़ यूज़र्स के लिए Google के Vertex AI प्लेटफॉर्म पर उपलब्ध है। इस तकनीक में SynthID वॉटरमार्किंग भी शामिल है, जिससे एआई-निर्मित कंटेंट की पहचान की जा सके और डीपफेक व गलत सूचना जैसी चिंताओं को दूर किया जा सके।