Malaking hakbang ang ginawa ng Google sa larangan ng AI media generation sa paglulunsad ng Veo 3 at Imagen 4 sa taunang I/O developer conference noong Mayo 20, 2025.
Ang Veo 3, ang pinakabagong video generation model ng Google, ay isang malaking pag-usad dahil ito ang unang beses na nagpakilala ang kumpanya ng kakayahang lumikha ng audio. Kayang gumawa ng Veo 3 ng mga video na may kasamang naka-sinkronisadong background sounds tulad ng ingay ng trapiko o huni ng mga ibon, at maging ng diyalogo ng mga karakter na may eksaktong lip syncing. Ipinapakita ng Veo 3 ang mas mataas na pag-unawa sa pisika ng totoong mundo at ekspresyon ng tao, kaya mas makatotohanan at detalyado ang mga video output nito.
Kasabay ng Veo 3, ipinakilala rin ng Google ang Imagen 4, ang pinaka-advanced nitong image generation model sa ngayon. Namumukod-tangi ang Imagen 4 sa pag-render ng maliliit na detalye tulad ng masalimuot na tela, patak ng tubig, at balahibo ng hayop nang may pambihirang linaw. Sinusuportahan ng modelong ito ang iba't ibang aspect ratio at kayang lumikha ng mga larawan hanggang 2K na resolusyon, na angkop para sa pagpi-print o presentasyon. Inanunsyo rin ng Google ang planong maglabas ng "fast variant" ng Imagen 4 na hanggang 10 beses na mas mabilis kaysa sa naunang bersyon, na idinisenyo para sa mabilisang prototyping at creative workflows.
Ang mga makapangyarihang AI model na ito ang nagsisilbing pundasyon ng Flow, ang bagong AI-powered filmmaking tool ng Google. Pinagsasama ng Flow ang kakayahan ng Veo, Imagen, at Gemini upang tulungan ang mga storyteller na lumikha ng cinematic na mga clip at eksena. May mga tampok itong Camera Controls para sa eksaktong galaw ng kamera, SceneBuilder para sa tuloy-tuloy na pagpapalawak ng mga shot, at Asset Management para sa organisadong paghawak ng mga creative na elemento. Pinapayagan ng Flow ang mga creator na mapanatili ang konsistensi ng mga karakter at eksena sa maraming clip, na nagbibigay ng mas buo at magkakaugnay na karanasan sa pagkukuwento.
Sa kasalukuyan, available ang Veo 3 sa mga Google AI Ultra subscriber sa Estados Unidos sa halagang $249.99 kada buwan, habang ang Imagen 4 ay maaaring ma-access sa pamamagitan ng Gemini app, Whisk, Vertex AI, at iba't ibang Google Workspace application. Lahat ng content na nilikha ng mga modelong ito ay may kasamang SynthID watermark upang matiyak ang transparency at labanan ang maling impormasyon.
Ipinapakita ng mga inobasyong ito ang patuloy na dedikasyon ng Google sa pagpapalawak ng kakayahan ng AI para sa mas maraming gumagamit. Inanunsyo rin ng kumpanya na mayroon nang mahigit 400 milyong buwanang aktibong user ang mga Gemini app, patunay ng mabilis na pagtanggap sa kanilang AI technologies.