Google posunul generovanie videí pomocou umelej inteligencie na novú úroveň s uvedením modelu Veo 3, ktorý ako prvý prináša do AI generovaných videí aj zvukové možnosti.
Predstavený na podujatí Google I/O 2025 v máji, Veo 3 predstavuje významný pokrok oproti predchádzajúcim generátorom videí s umelou inteligenciou vďaka integrácii synchronizovaných dialógov, ambientných zvukov a hudby priamo do vytvorených klipov. „Po prvýkrát sa dostávame z nemého obdobia generovania videí,“ povedal Demis Hassabis, CEO Google DeepMind, počas oznámenia.
Technológia vyniká v tvorbe realistických videí s presnou fyzikou, presným synchronizovaním pohybu pier a prirodzeným pohybom. Používatelia môžu generovať videá na základe textových opisov alebo obrázkových referencií, pričom AI automaticky pridáva vhodné zvukové prvky zodpovedajúce vizuálnemu obsahu. Táto schopnosť odlišuje Veo 3 od konkurencie, ako je OpenAI Sora, ktorá v súčasnosti natívnu generáciu zvuku neponúka.
Spolu s Veo 3 Google vylepšil aj svoj obľúbený model Veo 2 o niekoľko výkonných nových funkcií. Medzi ne patrí generovanie videí na základe referencií pre konzistentné postavy a objekty, pokročilé ovládanie kamery pre filmové pohyby, rozširovanie záberov (outpainting) za pôvodné okraje a inteligentné pridávanie či odstraňovanie objektov.
Na demonštráciu kreatívneho potenciálu týchto nástrojov Google predstavil Flow, novú AI platformu pre filmárov, ktorá kombinuje modely Veo, Imagen a Gemini. Niekoľko filmárov už pomocou tejto technológie vytvorilo profesionálne krátke filmy, vrátane emocionálneho sci-fi príbehu "Kitsune" od Henryho Daubreza a identity skúmajúceho filmu "Dear Stranger" od Junie Lau.
Veo 3 je momentálne dostupný pre amerických predplatiteľov Google AI Ultra plánu za 249,99 dolára mesačne prostredníctvom aplikácie Gemini, ako aj pre firemných používateľov cez platformu Google Vertex AI. Technológia obsahuje aj vodoznak SynthID na identifikáciu AI generovaného obsahu a riešenie obáv z deepfake videí a dezinformácií.