menu
close

Google predstavlja AI alate nove generacije za napredno stvaranje medijskih sadržaja

Na konferenciji Google I/O 2025, kompanija je predstavila Veo 3, revolucionarni AI model koji generira videozapise sa sinkroniziranim zvukom, uključujući ambijentalne zvukove i dijaloge likova. Google je također lansirao Imagen 4, koji prikazuje složene detalje izuzetnom jasnoćom i podržava rezoluciju do 2K. Ovi napredni AI modeli pokreću Flow, novi Googleov alat za filmsko stvaralaštvo osmišljen kako bi pomogao kreatorima da ožive svoje filmske vizije.
Google predstavlja AI alate nove generacije za napredno stvaranje medijskih sadržaja

Google je značajno unaprijedio svoje AI mogućnosti za generiranje medijskih sadržaja lansiranjem modela Veo 3 i Imagen 4 na godišnjoj I/O developerskoj konferenciji 20. svibnja 2025.

Veo 3, najnoviji Googleov model za generiranje videa, predstavlja veliki iskorak uvođenjem mogućnosti generiranja zvuka po prvi put. Model može stvarati videozapise sa sinkroniziranim pozadinskim zvukovima poput prometa ili cvrkuta ptica, pa čak i generirati dijaloge između likova s preciznom sinkronizacijom usana. Veo 3 pokazuje poboljšano razumijevanje stvarne fizike i ljudskih izraza, što rezultira realističnijim i detaljnijim video izlazima.

Uz Veo 3, Google je predstavio i Imagen 4, svoj najnapredniji model za generiranje slika do sada. Imagen 4 briljira u prikazu finih detalja poput složenih tkanina, kapljica vode i životinjske dlake izuzetnom jasnoćom. Model podržava različite omjere stranica i može stvarati slike u rezoluciji do 2K, čineći ih prikladnima za ispis ili prezentacije. Google je također najavio izdavanje "brze varijante" Imagen 4, koja će biti do 10 puta brža od prethodnika, optimizirana za brzo prototipiranje i kreativne radne procese.

Ovi snažni AI modeli čine temelj za Flow, novi Googleov alat za filmsko stvaralaštvo pokretan umjetnom inteligencijom. Flow kombinira mogućnosti modela Veo, Imagen i Gemini kako bi pripovjedačima omogućio stvaranje filmskih isječaka i scena. Alat nudi značajke poput Camera Controls za precizno upravljanje kamerom, SceneBuilder za besprijekorno proširivanje kadrova i Asset Management za organizaciju kreativnih elemenata. Flow omogućuje kreatorima održavanje konzistentnih likova i scena kroz više isječaka, pružajući koherentnije iskustvo pripovijedanja.

Veo 3 je trenutno dostupan pretplatnicima Google AI Ultra u Sjedinjenim Američkim Državama po cijeni od 249,99 USD mjesečno, dok je Imagen 4 dostupan putem Gemini aplikacije, Whisk, Vertex AI i raznih Google Workspace aplikacija. Sav sadržaj generiran ovim modelima uključuje SynthID vodene žigove radi osiguravanja transparentnosti i borbe protiv dezinformacija.

Ova dostignuća odražavaju Googleovu predanost širenju AI mogućnosti na više korisnika, a kompanija je također objavila da Gemini aplikacije sada imaju više od 400 milijuna mjesečno aktivnih korisnika, što pokazuje brzo usvajanje njihovih AI tehnologija.

Source:

Latest News