Google DeepMind posunul hranice AI generování videa s uvedením Veo 3, svého dosud nejsofistikovanějšího modelu pro tvorbu videí. Novinka, oznámená na Google I/O 2025, přináší filmovou kvalitu videí v rozlišení 1080p s dosud nevídaným realismem a úrovní ovládání.
Hlavní předností Veo 3 je schopnost nativní generace zvuku, která umožňuje vytvářet videa s ambientními zvuky, zvukovými efekty i synchronizovanými dialogy postav – což je klíčový rozdíl oproti konkurentům, jako je Sora od OpenAI. Tato integrace eliminuje potřebu samostatných nástrojů pro tvorbu zvuku a zjednodušuje celý kreativní proces.
„Veo 3 vyniká od textových a obrazových promptů až po simulaci reálné fyziky a přesnou synchronizaci rtů,“ vysvětluje Eli Collins, viceprezident produktového oddělení Google DeepMind. Model vykazuje výrazná zlepšení v přesnosti plnění zadání, což uživatelům umožňuje detailně specifikovat filmové prvky, jako jsou pohyby kamery, osvětlení nebo kompozice scény s vysokou precizností.
Veo 3 je aktuálně dostupné pro předplatitele Google AI Ultra ve Spojených státech za 249,99 USD měsíčně a je integrováno s Flow, novým nástrojem Googlu pro AI filmovou tvorbu určeným profesionálním tvůrcům. Platforma umožňuje filmařům a tvůrcům obsahu produkovat vysoce kvalitní videa bez potřeby tradičních produkčních prostředků.
Technologie obsahuje několik bezpečnostních opatření, včetně vodoznaku SynthID na každém snímku pro identifikaci AI generovaného obsahu. To reaguje na rostoucí obavy ze zneužití technologie k tvorbě deepfake videí nebo manipulovaných médií.
S tím, jak se nástroje pro AI generování videa stále zdokonalují, sílí i konkurence mezi Googlem a OpenAI. Zatímco Sora nabízí delší sekvence a pokročilou simulaci fyziky, Veo 3 boduje integrovaným zvukem a filmovými ovládacími prvky, což z něj činí atraktivní volbu pro profesionální tvůrce, kteří hledají komplexní řešení pro produkci videa.