Google telah membuat lonjakan besar dalam keupayaan penjanaan media berasaskan AI dengan pelancaran Veo 3 dan Imagen 4 di persidangan pembangun tahunan I/O pada 20 Mei 2025.
Veo 3, model penjanaan video terkini Google, menandakan kemajuan besar dengan memperkenalkan keupayaan penjanaan audio buat kali pertama. Model ini boleh mencipta video lengkap dengan bunyi latar yang segerak seperti bunyi trafik atau burung berkicau, malah mampu menjana dialog antara watak dengan penyegerakan bibir yang tepat. Veo 3 menunjukkan pemahaman yang lebih baik terhadap fizik dunia sebenar dan ekspresi manusia, menghasilkan output video yang lebih realistik dan terperinci.
Selain Veo 3, Google turut memperkenalkan Imagen 4, model penjanaan imej paling canggih setakat ini. Imagen 4 cemerlang dalam menghasilkan perincian halus seperti fabrik rumit, titisan air, dan bulu haiwan dengan kejelasan yang menakjubkan. Model ini menyokong pelbagai nisbah aspek dan boleh menghasilkan imej pada resolusi sehingga 2K, menjadikannya sesuai untuk cetakan atau pembentangan. Google juga mengumumkan rancangan untuk melancarkan "varian pantas" Imagen 4 yang akan 10 kali lebih laju berbanding pendahulunya, dioptimumkan untuk prototaip pantas dan aliran kerja kreatif.
Model-model AI berkuasa ini menjadi asas kepada Flow, alat pembikinan filem berkuasa AI baharu dari Google. Flow menggabungkan keupayaan Veo, Imagen, dan Gemini untuk membantu pencerita menghasilkan klip dan babak sinematik. Alat ini menawarkan ciri seperti Kawalan Kamera untuk pergerakan kamera yang tepat, SceneBuilder untuk memanjangkan babak secara lancar, dan Pengurusan Aset untuk mengatur elemen kreatif. Flow membolehkan pencipta mengekalkan watak dan babak yang konsisten merentasi pelbagai klip, memberikan pengalaman penceritaan yang lebih padu.
Veo 3 kini tersedia kepada pelanggan Google AI Ultra di Amerika Syarikat pada harga $249.99 sebulan, manakala Imagen 4 boleh diakses melalui aplikasi Gemini, Whisk, Vertex AI, dan pelbagai aplikasi Google Workspace. Semua kandungan yang dijana oleh model-model ini mengandungi tera air SynthID bagi memastikan ketelusan dan memerangi maklumat palsu.
Kemajuan ini mencerminkan komitmen Google untuk memperluaskan keupayaan AI kepada lebih ramai pengguna, dengan syarikat itu turut mengumumkan bahawa aplikasi Gemini kini mempunyai lebih 400 juta pengguna aktif bulanan, menunjukkan kadar penerimaan teknologi AI mereka yang pesat.