Google výrazne posunul svoje možnosti generovania médií pomocou umelej inteligencie predstavením modelov Veo 3 a Imagen 4 na výročnej vývojárskej konferencii I/O 20. mája 2025.
Veo 3, najnovší model Googlu na generovanie videí, predstavuje zásadný pokrok vďaka prvému zavedeniu schopnosti generovať zvuk. Model dokáže vytvárať videá so synchronizovanými zvukmi pozadia, ako je ruch dopravy alebo štebot vtákov, a dokonca generovať dialógy medzi postavami s presným synchronizovaním pohybu pier. Veo 3 preukazuje lepšie pochopenie reálnej fyziky a ľudských emócií, čo vedie k realistickejším a detailnejším video výstupom.
Popri Veo 3 Google predstavil aj Imagen 4, svoj doteraz najpokročilejší model na generovanie obrázkov. Imagen 4 vyniká vo vykresľovaní jemných detailov, ako sú zložité textílie, kvapky vody či srsť zvierat, s mimoriadnou ostrosťou. Model podporuje rôzne pomery strán a dokáže vytvárať obrázky v rozlíšení až do 2K, vďaka čomu sú vhodné na tlač aj prezentácie. Google zároveň oznámil plány na vydanie „rýchlej varianty“ Imagen 4, ktorá bude až desaťkrát rýchlejšia než jej predchodca a optimalizovaná pre rýchle prototypovanie a kreatívne pracovné postupy.
Tieto výkonné AI modely tvoria základ nového filmárskeho nástroja Flow, ktorý je poháňaný umelou inteligenciou od Googlu. Flow kombinuje schopnosti modelov Veo, Imagen a Gemini, aby pomohol rozprávačom príbehov vytvárať filmové klipy a scény. Nástroj ponúka funkcie ako Camera Controls pre presné pohyby kamery, SceneBuilder na plynulé rozširovanie záberov či Asset Management na organizáciu kreatívnych prvkov. Flow umožňuje tvorcom zachovať konzistentnosť postáv a scén naprieč viacerými klipmi, čím poskytuje ucelenejší zážitok z rozprávania príbehu.
Veo 3 je aktuálne dostupný pre predplatiteľov Google AI Ultra v Spojených štátoch za cenu 249,99 USD mesačne, zatiaľ čo Imagen 4 je prístupný prostredníctvom aplikácie Gemini, Whisk, Vertex AI a rôznych aplikácií Google Workspace. Všetok obsah generovaný týmito modelmi obsahuje vodoznaky SynthID na zabezpečenie transparentnosti a boj proti dezinformáciám.
Tieto pokroky odrážajú záväzok Googlu rozširovať možnosti umelej inteligencie pre širšie spektrum používateľov. Spoločnosť zároveň oznámila, že aplikácie Gemini už využíva viac ako 400 miliónov aktívnych používateľov mesačne, čo dokazuje rýchle prijatie jej AI technológií.