menu
close

Google představuje nové generace AI nástrojů pro pokročilou tvorbu médií

Na konferenci Google I/O 2025 společnost představila Veo 3, průlomový AI model generující videa se synchronizovaným zvukem včetně ambientních efektů a dialogů postav. Google rovněž uvedl Imagen 4, který vykresluje složité detaily s mimořádnou ostrostí a podporuje rozlišení až 2K. Tyto pokročilé AI modely pohánějí Flow, nový nástroj Googlu pro filmovou tvorbu, který pomáhá tvůrcům realizovat filmové vize.
Google představuje nové generace AI nástrojů pro pokročilou tvorbu médií

Google výrazně posunul své schopnosti v oblasti generování médií pomocí umělé inteligence díky uvedení modelů Veo 3 a Imagen 4 na své každoroční vývojářské konferenci I/O dne 20. května 2025.

Veo 3, nejnovější model Googlu pro generování videí, představuje zásadní pokrok díky zavedení schopnosti generovat zvuk. Model dokáže vytvářet videa se synchronizovanými zvuky pozadí, jako je ruch dopravy nebo zpěv ptáků, a dokonce generovat dialogy mezi postavami s přesným synchronizováním rtů. Veo 3 prokazuje lepší porozumění reálné fyzice a lidským výrazům, což vede k realističtějším a detailnějším video výstupům.

Spolu s Veo 3 Google představil také Imagen 4, svůj dosud nejpokročilejší model pro generování obrázků. Imagen 4 vyniká ve vykreslování jemných detailů, jako jsou složité textilie, kapky vody nebo zvířecí srst, s mimořádnou ostrostí. Model podporuje různé poměry stran a dokáže vytvářet obrázky v rozlišení až 2K, což je činí vhodnými pro tisk nebo prezentace. Google také oznámil plány na uvedení „rychlé varianty“ Imagen 4, která bude až 10krát rychlejší než její předchůdce a optimalizovaná pro rychlé prototypování a kreativní pracovní postupy.

Tyto výkonné AI modely tvoří základ pro Flow, nový nástroj Googlu poháněný umělou inteligencí pro filmovou tvorbu. Flow kombinuje schopnosti modelů Veo, Imagen a Gemini, aby pomohl vypravěčům vytvářet filmové klipy a scény. Nástroj nabízí funkce jako Camera Controls pro přesné pohyby kamery, SceneBuilder pro plynulé rozšiřování záběrů a Asset Management pro organizaci kreativních prvků. Flow umožňuje tvůrcům udržovat konzistentní postavy a scény napříč více klipy, což zajišťuje soudržnější vyprávění příběhu.

Veo 3 je aktuálně dostupné předplatitelům Google AI Ultra ve Spojených státech za cenu 249,99 USD měsíčně, zatímco Imagen 4 je přístupný prostřednictvím aplikace Gemini, Whisk, Vertex AI a různých aplikací Google Workspace. Veškerý obsah generovaný těmito modely obsahuje vodoznaky SynthID pro zajištění transparentnosti a boj proti dezinformacím.

Tyto inovace odrážejí závazek Googlu rozšiřovat možnosti umělé inteligence pro širší okruh uživatelů. Společnost zároveň oznámila, že aplikace Gemini nyní používá více než 400 milionů aktivních uživatelů měsíčně, což dokládá rychlé přijetí jejích AI technologií.

Source:

Latest News