Google prezintă instrumente AI de nouă generație pentru creație media avansată

La Google I/O 2025, compania a lansat Veo 3, un model AI revoluționar care generează videoclipuri cu sunet sincronizat, inclusiv ambianță și dialoguri între personaje. Google a prezentat și Imagen 4, capabil să redea detalii complexe cu o claritate remarcabilă și să suporte rezoluții de până la 2K. Aceste modele AI avansate alimentează Flow, noul instrument Google pentru realizarea de filme, conceput pentru a ajuta creatorii să-și aducă la viață viziunile cinematografice.

Google a făcut progrese semnificative în generarea media cu ajutorul inteligenței artificiale, odată cu lansarea Veo 3 și Imagen 4 la conferința anuală I/O pentru dezvoltatori, pe 20 mai 2025.

Veo 3, cel mai nou model de generare video al Google, marchează un salt major prin introducerea pentru prima dată a capabilităților de generare audio. Modelul poate crea videoclipuri complete cu sunete de fundal sincronizate, precum zgomotul traficului sau ciripitul păsărilor, și chiar poate genera dialoguri între personaje cu sincronizare precisă a buzelor. Veo 3 demonstrează o înțelegere îmbunătățită a fizicii reale și a expresiilor umane, rezultând în videoclipuri mai realiste și mai detaliate.

Alături de Veo 3, Google a prezentat Imagen 4, cel mai avansat model de generare de imagini de până acum. Imagen 4 excelează la redarea detaliilor fine, precum țesături complexe, picături de apă sau blana animalelor, cu o claritate impresionantă. Modelul suportă diverse rapoarte de aspect și poate crea imagini la rezoluții de până la 2K, potrivite pentru print sau prezentări. Google a anunțat, de asemenea, lansarea unei „variante rapide” a Imagen 4, de până la 10 ori mai rapidă decât predecesorul său, optimizată pentru prototipare rapidă și fluxuri creative.

Aceste modele AI puternice stau la baza Flow, noul instrument Google pentru realizarea de filme asistat de inteligență artificială. Flow combină capabilitățile Veo, Imagen și Gemini pentru a ajuta creatorii să realizeze clipuri și scene cinematografice. Instrumentul oferă funcții precum Camera Controls pentru mișcări precise ale camerei, SceneBuilder pentru extinderea fluidă a cadrelor și Asset Management pentru organizarea elementelor creative. Flow permite creatorilor să mențină consistența personajelor și a scenelor pe parcursul mai multor clipuri, oferind o experiență narativă coerentă.

Veo 3 este disponibil momentan abonaților Google AI Ultra din Statele Unite, la prețul de 249,99 dolari pe lună, în timp ce Imagen 4 poate fi accesat prin aplicația Gemini, Whisk, Vertex AI și diverse aplicații Google Workspace. Tot conținutul generat de aceste modele include watermark-uri SynthID pentru a asigura transparența și a combate dezinformarea.

Aceste progrese reflectă angajamentul Google de a extinde capabilitățile AI către mai mulți utilizatori, compania anunțând totodată că aplicațiile Gemini au depășit 400 de milioane de utilizatori activi lunar, demonstrând adoptarea rapidă a tehnologiilor sale AI.

Source:

Google prezintă instrumente AI de nouă generație pentru creație media avansată

Latest News

Doubao AI de la ByteDance Oferă Acum Asistență Video în Timp Real

OnePlus renunță la Alert Slider în favoarea butonului Plus Key alimentat de AI

Giganții tehnologici germani se unesc pentru o gigafabrică de inteligență artificială susținută de UE

Procurorii americani au investigat Builder.ai înainte ca startup-ul AI de 1,5 miliarde de dolari să se prăbușească

Fondul de 1,8 trilioane de dolari al Norvegiei face din inteligența artificială o cerință obligatorie pentru angajați

OpenTools.ai lansează un hub de știri AI pentru profesioniștii din tehnologie

Google extinde controlul AI asupra computerului pentru dezvoltatori prin Gemini

Google îmbunătățește modelele Gemini cu rezumate transparente ale procesului de gândire

Google prezintă instrumente AI de nouă generație pentru creație media avansată

Related Articles

Doubao AI de la ByteDance Oferă Acum Asistență Video în Timp Real

Google extinde controlul AI asupra computerului pentru dezvoltatori prin Gemini

Google îmbunătățește modelele Gemini cu rezumate transparente ale procesului de gândire

Google extinde controlul costurilor AI la Gemini 2.5 Pro

Google readuce la viață ochelarii inteligenți cu traducere în timp real, alimentată de Gemini

Latest News

Doubao AI de la ByteDance Oferă Acum Asistență Video în Timp Real

OnePlus renunță la Alert Slider în favoarea butonului Plus Key alimentat de AI

Giganții tehnologici germani se unesc pentru o gigafabrică de inteligență artificială susținută de UE

Procurorii americani au investigat Builder.ai înainte ca startup-ul AI de 1,5 miliarde de dolari să se prăbușească

Fondul de 1,8 trilioane de dolari al Norvegiei face din inteligența artificială o cerință obligatorie pentru angajați

OpenTools.ai lansează un hub de știri AI pentru profesioniștii din tehnologie

Google extinde controlul AI asupra computerului pentru dezvoltatori prin Gemini

Google îmbunătățește modelele Gemini cu rezumate transparente ale procesului de gândire