Google Veo 3 přináší zvuk do generování videí pomocí AI

Google představil Veo 3, svůj dosud nejpokročilejší model pro generování videí pomocí umělé inteligence, který dokáže vytvářet videa se synchronizovaným zvukem, včetně dialogů a zvukových efektů. Technologie je dostupná pro předplatitele služby Google AI Ultra v USA a prostřednictvím Vertex AI. Tento průlom znamená konec 'němé éry' generování videí pomocí AI. Google také vylepšil model Veo 2 o nové funkce, jako jsou ovládání kamery, rozšiřování obrazu a manipulace s objekty.

Google posunul generování videí pomocí umělé inteligence na novou úroveň s uvedením modelu Veo 3, průlomového systému, který poprvé přináší do AI generovaných videí zvukové možnosti.

Představený na konferenci Google I/O 2025 v květnu, Veo 3 představuje významný pokrok oproti předchozím generátorům videí s umělou inteligencí díky integraci synchronizovaných dialogů, ambientních zvuků a hudby přímo do generovaných klipů. „Poprvé opouštíme němou éru generování videí,“ uvedl při oznámení Demis Hassabis, generální ředitel Google DeepMind.

Technologie vyniká tvorbou realistických videí s přesnou fyzikou, precizní synchronizací rtů a přirozeným pohybem. Uživatelé mohou generovat videa zadáním textového popisu nebo poskytnutím obrazových referencí, přičemž AI automaticky přidá odpovídající zvukové prvky, které ladí s vizuálním obsahem. Tato schopnost odlišuje Veo 3 od konkurentů, jako je Sora od OpenAI, která zatím nativní generování zvuku nenabízí.

Spolu s Veo 3 Google vylepšil i svůj populární model Veo 2 o několik nových funkcí. Patří mezi ně generování videí na základě referencí pro konzistentní postavy a objekty, pokročilé ovládání kamery pro filmové pohyby, rozšiřování obrazu za původní okraje (outpainting) a inteligentní přidávání či odstraňování objektů.

Aby Google předvedl kreativní potenciál těchto nástrojů, představil také Flow, novou platformu pro tvorbu filmů s pomocí AI, která kombinuje modely Veo, Imagen a Gemini. Několik filmařů už díky této technologii vytvořilo profesionálně působící krátké filmy, například emotivní sci-fi příběh „Kitsune“ od Henryho Daubreze nebo zkoumání identity „Dear Stranger“ od Junie Lau.

Veo 3 je aktuálně dostupný pro americké předplatitele měsíčního plánu Google AI Ultra za 249,99 USD prostřednictvím aplikace Gemini a také pro firemní zákazníky přes platformu Google Vertex AI. Technologie obsahuje vodoznak SynthID, který pomáhá identifikovat obsah vytvořený umělou inteligencí a řešit obavy z deepfake videí a dezinformací.

Source:

Google Veo 3 přináší zvuk do generování videí pomocí AI

Latest News

Meta uvádí LLaMA 4: Revoluce hlasového ovládání umělé inteligence

Home Depot digitalizuje odborné poradenství pomocí AI nástroje Magic Apron

Shield AI získává 240 milionů dolarů v době rozmachu obranných technologií

Léčivo Rentosertib navržené umělou inteligencí vykazuje slibné výsledky v průlomové klinické studii

Technologičtí giganti představují pokročilé funkce podnikových AI chatbotů

Švýcarský průlom v oblasti AI výrazně snižuje uhlíkovou stopu cementu

OpenAI dosáhla hranice 10 miliard dolarů v tržbách díky zrychlujícímu se přijetí AI

Google představuje Gemini 2.5 Flash s vylepšenými schopnostmi programování

Microsoft vyzývá OpenAI novou technologií AI pro logické uvažování

Modely AI s rozumovým uvažováním vypouštějí 50krát více uhlíku než základní modely

Google Veo 3 přináší zvuk do generování videí pomocí AI

Related Articles

Microsoft vyzývá OpenAI novou technologií AI pro logické uvažování

Google představuje Gemini 2.5 Flash s vylepšenými schopnostmi programování

Google Imagen 4 revolucionalizuje generování AI obrázků realistickými detaily

Google představuje detektor SynthID v boji proti klamání AI obsahem

Meta uvádí LLaMA 4: Revoluce hlasového ovládání umělé inteligence

Latest News

Meta uvádí LLaMA 4: Revoluce hlasového ovládání umělé inteligence

Home Depot digitalizuje odborné poradenství pomocí AI nástroje Magic Apron

Shield AI získává 240 milionů dolarů v době rozmachu obranných technologií

Léčivo Rentosertib navržené umělou inteligencí vykazuje slibné výsledky v průlomové klinické studii

Technologičtí giganti představují pokročilé funkce podnikových AI chatbotů

Švýcarský průlom v oblasti AI výrazně snižuje uhlíkovou stopu cementu

OpenAI dosáhla hranice 10 miliard dolarů v tržbách díky zrychlujícímu se přijetí AI

Google představuje Gemini 2.5 Flash s vylepšenými schopnostmi programování

Microsoft vyzývá OpenAI novou technologií AI pro logické uvažování

Modely AI s rozumovým uvažováním vypouštějí 50krát více uhlíku než základní modely