MagicTime: AI model se učí fyziku pro tvorbu realistických metamorfních videí

Počítačoví vědci vyvinuli MagicTime, průlomový AI model pro převod textu na video, který se učí znalosti reálné fyziky z časosběrných dat. Tento model, představený 5. května 2025, je výsledkem spolupráce výzkumníků z University of Rochester, Pekingské univerzity, UC Santa Cruz a National University of Singapore a představuje významný pokrok v generování metamorfních videí, která přesně simulují fyzikální proměny. Technologie by mohla zásadně změnit vědeckou vizualizaci, tvorbu obsahu i vzdělávací nástroje díky možnosti realistického generování videí z jednoduchých textových popisů.

Zatímco AI modely pro převod textu na video, jako je Sora od OpenAI, dosáhly působivých výsledků v generování videí, narážely na obtíže při tvorbě realistických metamorfních videí – tedy záznamů postupných proměn, jako je rozkvétání květin nebo stavba budov. Tyto procesy jsou pro AI obzvlášť náročné na simulaci, protože vyžadují hluboké pochopení reálné fyziky a mohou mít velmi různorodý vzhled.

Nově vyvinutý model MagicTime tuto slabinu překonává tím, že se fyzikální znalosti učí přímo z časosběrných videí. Mezinárodní tým vedený doktorandem Jinfa Huangem a profesorem Jiebo Luo z katedry informatiky University of Rochester trénoval svůj model na vysoce kvalitní databázi více než 2 000 pečlivě okomentovaných časosběrných videí, aby zachytil nuance fyzikálních proměn.

Aktuální open-source verze modelu generuje dvousekundové klipy v rozlišení 512×512 pixelů, přičemž doprovodná architektura založená na difuzi a transformerech umožňuje prodloužení až na desetisekundová videa. MagicTime dokáže simulovat různé metamorfní procesy, včetně biologického růstu, stavebních projektů nebo dokonce kulinářských proměn, jako je pečení chleba.

„MagicTime je krokem k AI, která dokáže lépe simulovat fyzikální, chemické, biologické či sociální vlastnosti světa kolem nás,“ vysvětluje Huang. Výzkumníci vidí významné vědecké využití i mimo oblast zábavy a naznačují, že „biologové by mohli generativní video využít k rychlejšímu předběžnému zkoumání nápadů“ a zároveň snížit potřebu fyzických experimentů.

Dopad této technologie zasahuje do mnoha oblastí. Ve vzdělávání může vytvářet dynamické vizualizace složitých procesů, které je obtížné pozorovat v reálném čase. Tvůrcům obsahu a zábavnímu průmyslu nabízí nové nástroje pro speciální efekty a vyprávění příběhů. Vědci ji mohou využít k modelování a predikci fyzikálních jevů, což může urychlit výzkum v oborech od biologie po materiálové vědy.

Jak se AI stále více propojuje s fyzikálním modelováním, MagicTime ukazuje, že začlenění oborově specifických znalostí do generativních modelů může vést k výsledkům, které jsou nejen vizuálně působivé, ale i vědecky hodnotné. Výzkum byl publikován v časopise IEEE Transactions on Pattern Analysis and Machine Intelligence.

MagicTime: AI model se učí fyziku pro tvorbu realistických metamorfních videí

Latest News

ByteDanceův Doubao AI nyní nabízí asistenci v reálném čase přes video

OnePlus opouští přepínač režimů a nahrazuje jej AI tlačítkem Plus Key

Němečtí technologičtí giganti spojili síly pro evropskou AI gigatovárnu s podporou EU

Američtí prokurátoři vyšetřovali Builder.ai před krachem AI startupu za 1,5 miliardy dolarů

Norský fond v hodnotě 1,8 bilionu dolarů zavádí AI jako povinnou pro všechny zaměstnance

OpenTools.ai představuje AI News Hub pro technologické profesionály

Google rozšiřuje ovládání počítače pomocí AI pro vývojáře skrze Gemini

Google vylepšuje modely Gemini o transparentní shrnutí myšlenkových procesů

MagicTime: AI model se učí fyziku pro tvorbu realistických metamorfních videí

Related Articles

ByteDanceův Doubao AI nyní nabízí asistenci v reálném čase přes video

OnePlus opouští přepínač režimů a nahrazuje jej AI tlačítkem Plus Key

Němečtí technologičtí giganti spojili síly pro evropskou AI gigatovárnu s podporou EU

Latest News

ByteDanceův Doubao AI nyní nabízí asistenci v reálném čase přes video

OnePlus opouští přepínač režimů a nahrazuje jej AI tlačítkem Plus Key

Němečtí technologičtí giganti spojili síly pro evropskou AI gigatovárnu s podporou EU

Američtí prokurátoři vyšetřovali Builder.ai před krachem AI startupu za 1,5 miliardy dolarů

Norský fond v hodnotě 1,8 bilionu dolarů zavádí AI jako povinnou pro všechny zaměstnance

OpenTools.ai představuje AI News Hub pro technologické profesionály

Google rozšiřuje ovládání počítače pomocí AI pro vývojáře skrze Gemini

Google vylepšuje modely Gemini o transparentní shrnutí myšlenkových procesů