menu
close

Google prezintă instrumente AI de nouă generație pentru creație media avansată

La Google I/O 2025, compania a lansat Veo 3, un model AI revoluționar care generează videoclipuri cu sunet sincronizat, inclusiv ambianță și dialoguri între personaje. Google a prezentat și Imagen 4, capabil să redea detalii complexe cu o claritate remarcabilă și să suporte rezoluții de până la 2K. Aceste modele AI avansate alimentează Flow, noul instrument Google pentru realizarea de filme, conceput pentru a ajuta creatorii să-și aducă la viață viziunile cinematografice.
Google prezintă instrumente AI de nouă generație pentru creație media avansată

Google a făcut progrese semnificative în generarea media cu ajutorul inteligenței artificiale, odată cu lansarea Veo 3 și Imagen 4 la conferința anuală I/O pentru dezvoltatori, pe 20 mai 2025.

Veo 3, cel mai nou model de generare video al Google, marchează un salt major prin introducerea pentru prima dată a capabilităților de generare audio. Modelul poate crea videoclipuri complete cu sunete de fundal sincronizate, precum zgomotul traficului sau ciripitul păsărilor, și chiar poate genera dialoguri între personaje cu sincronizare precisă a buzelor. Veo 3 demonstrează o înțelegere îmbunătățită a fizicii reale și a expresiilor umane, rezultând în videoclipuri mai realiste și mai detaliate.

Alături de Veo 3, Google a prezentat Imagen 4, cel mai avansat model de generare de imagini de până acum. Imagen 4 excelează la redarea detaliilor fine, precum țesături complexe, picături de apă sau blana animalelor, cu o claritate impresionantă. Modelul suportă diverse rapoarte de aspect și poate crea imagini la rezoluții de până la 2K, potrivite pentru print sau prezentări. Google a anunțat, de asemenea, lansarea unei „variante rapide” a Imagen 4, de până la 10 ori mai rapidă decât predecesorul său, optimizată pentru prototipare rapidă și fluxuri creative.

Aceste modele AI puternice stau la baza Flow, noul instrument Google pentru realizarea de filme asistat de inteligență artificială. Flow combină capabilitățile Veo, Imagen și Gemini pentru a ajuta creatorii să realizeze clipuri și scene cinematografice. Instrumentul oferă funcții precum Camera Controls pentru mișcări precise ale camerei, SceneBuilder pentru extinderea fluidă a cadrelor și Asset Management pentru organizarea elementelor creative. Flow permite creatorilor să mențină consistența personajelor și a scenelor pe parcursul mai multor clipuri, oferind o experiență narativă coerentă.

Veo 3 este disponibil momentan abonaților Google AI Ultra din Statele Unite, la prețul de 249,99 dolari pe lună, în timp ce Imagen 4 poate fi accesat prin aplicația Gemini, Whisk, Vertex AI și diverse aplicații Google Workspace. Tot conținutul generat de aceste modele include watermark-uri SynthID pentru a asigura transparența și a combate dezinformarea.

Aceste progrese reflectă angajamentul Google de a extinde capabilitățile AI către mai mulți utilizatori, compania anunțând totodată că aplicațiile Gemini au depășit 400 de milioane de utilizatori activi lunar, demonstrând adoptarea rapidă a tehnologiilor sale AI.

Source:

Latest News