Google ने अपने अत्याधुनिक Veo3 वीडियो जनरेशन मॉडल का वैश्विक रोलआउट पूरा कर लिया है, जिससे यह तकनीक 3 जुलाई 2025 से 159 से अधिक देशों में Gemini उपयोगकर्ताओं के लिए उपलब्ध हो गई है। यह विस्तार एआई-आधारित वीडियो निर्माण के क्षेत्र में एक महत्वपूर्ण मील का पत्थर है। Google DeepMind के सीईओ डेमिस हासाबिस ने इसे 'वीडियो जनरेशन के साइलेंट युग से बाहर निकलना' बताया है।
पहली बार मई 2025 में Google I/O में पेश किया गया Veo3 अपने पूर्ववर्ती की तुलना में बड़ा उन्नयन है, क्योंकि यह उच्च-गुणवत्ता वाले वीडियो के साथ पूरी तरह सिंक्रनाइज़ ऑडियो तैयार करता है। यह मॉडल यथार्थवादी संवाद, परिवेशी ध्वनियाँ और साउंड इफेक्ट्स उत्पन्न कर सकता है, जो दृश्य सामग्री के साथ पूरी तरह मेल खाते हैं और बेहद जीवंत परिणाम देते हैं। वीडियो अधिकतम 4K रेज़ोल्यूशन में बनाए जा सकते हैं, हालांकि अधिकांश उपयोगकर्ताओं के लिए मानक आउटपुट 720p है।
Veo3 तक पहुँच सब्सक्रिप्शन टियर के अनुसार भिन्न है। Google AI Ultra सब्सक्राइबर्स ($249.99/माह) को मॉडल की सभी क्षमताओं की पूरी पहुँच मिलती है, जबकि AI Pro सब्सक्राइबर्स ($19.99/माह) प्रतिदिन तीन Veo3 Fast वीडियो (प्रत्येक अधिकतम आठ सेकंड) बना सकते हैं। यह तकनीक Flow में एकीकृत है, जो Google का नया एआई फिल्ममेकिंग टूल है और इसमें Veo3 के साथ-साथ Imagen और Gemini जैसे अन्य DeepMind मॉडल भी शामिल हैं।
गहरी नकली (डीपफेक) वीडियो की चिंताओं को दूर करने के लिए इस तकनीक में कई सुरक्षा उपाय शामिल किए गए हैं। Google की स्वामित्व वाली SynthID वॉटरमार्किंग तकनीक जेनरेटेड फ्रेम्स में अदृश्य मार्कर जोड़ती है, जिसकी नियंत्रित परीक्षणों में 99.3 प्रतिशत पहचान सटीकता बताई गई है। प्रत्येक वीडियो में निर्माण मेटाडेटा भी होता है, जो C2PA मानकों के अनुरूप है और एंड-टू-एंड ट्रैकिंग को सक्षम बनाता है।
उद्योग पर्यवेक्षकों का मानना है कि इसका उपयोग मनोरंजन से आगे भी हो सकता है। डेमिस हासाबिस ने हाल ही में 'प्लेएबल वर्ल्ड मॉडल्स' पर एक सोशल मीडिया पोस्ट के जवाब में गेमिंग अनुप्रयोगों की संभावना का संकेत दिया—'अब वह कुछ खास होगा'। हालांकि, यह तकनीक पहले ही विवादों में आ चुकी है; Media Matters for America ने रिपोर्ट किया कि जुलाई की शुरुआत में TikTok पर Veo3 का उपयोग कर नस्लवादी और यहूदी विरोधी वीडियो बनाए गए।