Google DeepMind posunul hranice AI generovaných videí predstavením Veo 3, svojho doposiaľ najsofistikovanejšieho modelu na tvorbu videí. Novinka, oznámená na Google I/O 2025, prináša filmovú kvalitu videí v rozlíšení 1080p s bezprecedentným realizmom a možnosťami ovládania.
Hlavnou prednosťou Veo 3 je natívna schopnosť generovať zvuk, vďaka čomu dokáže vytvárať videá so všetkými sprievodnými zvukmi, efektmi a dokonca aj synchronizovaným dialógom postáv – čo je zásadný rozdiel oproti konkurentom ako Sora od OpenAI. Táto integrácia eliminuje potrebu samostatných nástrojov na tvorbu zvuku a zjednodušuje kreatívny proces.
„Veo 3 vyniká od textových a obrazových podnetov až po simuláciu reálnej fyziky a presnú synchronizáciu pier,“ vysvetľuje Eli Collins, viceprezident produktového oddelenia Google DeepMind. Model prináša výrazné zlepšenia v dodržiavaní zadania, čo umožňuje používateľom presne špecifikovať filmárske prvky ako pohyby kamery, osvetlenie či kompozíciu scény.
Veo 3 je momentálne dostupné pre predplatiteľov Google AI Ultra v Spojených štátoch za 249,99 USD mesačne a je integrované s Flow, novým nástrojom Googlu na tvorbu filmov pomocou AI, určeným najmä pre kreatívnych profesionálov. Platforma umožňuje filmárom a tvorcom obsahu produkovať videá vo vysokej kvalite aj bez tradičných produkčných zdrojov.
Technológia obsahuje viacero bezpečnostných opatrení, vrátane vodoznaku SynthID na každom snímku, ktorý identifikuje AI generovaný obsah. Tým reaguje na rastúce obavy z možného zneužitia na tvorbu deepfake videí alebo manipulovaných médií.
S rastúcou sofistikovanosťou nástrojov na generovanie videí pomocou AI sa súboj medzi Googlom a OpenAI ďalej vyostruje. Zatiaľ čo Sora ponúka dlhšie sekvencie a pokročilú simuláciu fyziky, Veo 3 vyniká integrovaným zvukom a filmárskymi ovládacími prvkami, vďaka čomu je atraktívnou voľbou pre profesionálnych tvorcov, ktorí hľadajú komplexné riešenie pre produkciu videí.