Google Veo 3 prináša zvuk do AI generovania videí

Google predstavil Veo 3, svoj najpokročilejší model na generovanie videí pomocou umelej inteligencie, ktorý dokáže vytvárať videá so synchronizovaným zvukom vrátane dialógov a zvukových efektov. Novinka je dostupná pre predplatiteľov Google AI Ultra v USA a prostredníctvom Vertex AI. Táto prelomová technológia znamená koniec 'nemého obdobia' AI generovania videí. Google zároveň vylepšil Veo 2 o nové funkcie ako ovládanie kamery, rozširovanie záberov a manipuláciu s objektmi.

Google posunul generovanie videí pomocou umelej inteligencie na novú úroveň s uvedením modelu Veo 3, ktorý ako prvý prináša do AI generovaných videí aj zvukové možnosti.

Predstavený na podujatí Google I/O 2025 v máji, Veo 3 predstavuje významný pokrok oproti predchádzajúcim generátorom videí s umelou inteligenciou vďaka integrácii synchronizovaných dialógov, ambientných zvukov a hudby priamo do vytvorených klipov. „Po prvýkrát sa dostávame z nemého obdobia generovania videí,“ povedal Demis Hassabis, CEO Google DeepMind, počas oznámenia.

Technológia vyniká v tvorbe realistických videí s presnou fyzikou, presným synchronizovaním pohybu pier a prirodzeným pohybom. Používatelia môžu generovať videá na základe textových opisov alebo obrázkových referencií, pričom AI automaticky pridáva vhodné zvukové prvky zodpovedajúce vizuálnemu obsahu. Táto schopnosť odlišuje Veo 3 od konkurencie, ako je OpenAI Sora, ktorá v súčasnosti natívnu generáciu zvuku neponúka.

Spolu s Veo 3 Google vylepšil aj svoj obľúbený model Veo 2 o niekoľko výkonných nových funkcií. Medzi ne patrí generovanie videí na základe referencií pre konzistentné postavy a objekty, pokročilé ovládanie kamery pre filmové pohyby, rozširovanie záberov (outpainting) za pôvodné okraje a inteligentné pridávanie či odstraňovanie objektov.

Na demonštráciu kreatívneho potenciálu týchto nástrojov Google predstavil Flow, novú AI platformu pre filmárov, ktorá kombinuje modely Veo, Imagen a Gemini. Niekoľko filmárov už pomocou tejto technológie vytvorilo profesionálne krátke filmy, vrátane emocionálneho sci-fi príbehu "Kitsune" od Henryho Daubreza a identity skúmajúceho filmu "Dear Stranger" od Junie Lau.

Veo 3 je momentálne dostupný pre amerických predplatiteľov Google AI Ultra plánu za 249,99 dolára mesačne prostredníctvom aplikácie Gemini, ako aj pre firemných používateľov cez platformu Google Vertex AI. Technológia obsahuje aj vodoznak SynthID na identifikáciu AI generovaného obsahu a riešenie obáv z deepfake videí a dezinformácií.

Source:

Google Veo 3 prináša zvuk do AI generovania videí

Latest News

Meta uvádza LLaMA 4: Revolúcia hlasového ovládania v AI

Home Depot digitalizuje odborné poradenstvo pomocou AI asistenta Magic Apron

Shield AI získava 240 miliónov dolárov v čase akcelerujúceho boomu obranných technológií

AI-navrhnutý liek Rentosertib ukazuje sľubné výsledky v prelomovej klinickej štúdii

Technologickí giganti predstavili pokročilé funkcie AI chatbotov pre podniky

Švajčiarsky prelom v oblasti umelej inteligencie znižuje uhlíkovú stopu cementu

OpenAI dosiahol hranicu 10 miliárd dolárov v tržbách vďaka zrýchľujúcej sa adopcii AI

Google predstavuje Gemini 2.5 Flash s vylepšeným výkonom pri programovaní

Microsoft vyzýva OpenAI novou technológiou AI na logické uvažovanie

Modely AI s rozumovým uvažovaním vypúšťajú 50-krát viac uhlíka než základné modely

Google Veo 3 prináša zvuk do AI generovania videí

Related Articles

Microsoft vyzýva OpenAI novou technológiou AI na logické uvažovanie

Google predstavuje Gemini 2.5 Flash s vylepšeným výkonom pri programovaní

Google Imagen 4 revolučne mení generovanie AI obrázkov s realistickými detailmi

Google predstavuje detektor SynthID na boj proti dezinformáciám z AI obsahu

Meta uvádza LLaMA 4: Revolúcia hlasového ovládania v AI

Latest News

Meta uvádza LLaMA 4: Revolúcia hlasového ovládania v AI

Home Depot digitalizuje odborné poradenstvo pomocou AI asistenta Magic Apron

Shield AI získava 240 miliónov dolárov v čase akcelerujúceho boomu obranných technológií

AI-navrhnutý liek Rentosertib ukazuje sľubné výsledky v prelomovej klinickej štúdii

Technologickí giganti predstavili pokročilé funkcie AI chatbotov pre podniky

Švajčiarsky prelom v oblasti umelej inteligencie znižuje uhlíkovú stopu cementu

OpenAI dosiahol hranicu 10 miliárd dolárov v tržbách vďaka zrýchľujúcej sa adopcii AI

Google predstavuje Gemini 2.5 Flash s vylepšeným výkonom pri programovaní

Microsoft vyzýva OpenAI novou technológiou AI na logické uvažovanie

Modely AI s rozumovým uvažovaním vypúšťajú 50-krát viac uhlíka než základné modely