Google membawa teknologi generasi video AI ke level baru dengan merilis Veo 3, sebuah model revolusioner yang untuk pertama kalinya menambahkan kemampuan audio pada video yang dihasilkan AI.
Diperkenalkan pada ajang Google I/O 2025 bulan Mei lalu, Veo 3 menjadi lompatan signifikan dibandingkan generator video AI sebelumnya dengan mengintegrasikan dialog tersinkronisasi, suara latar, dan musik latar langsung ke dalam klip yang dihasilkan. "Untuk pertama kalinya, kita keluar dari era bisu dalam generasi video," ujar Demis Hassabis, CEO Google DeepMind, saat pengumuman.
Teknologi ini unggul dalam menciptakan video realistis dengan fisika yang akurat, sinkronisasi bibir yang presisi, dan gerakan alami. Pengguna dapat menghasilkan video hanya dengan memberikan deskripsi teks atau referensi gambar, dan AI secara otomatis menambahkan elemen audio yang sesuai dengan konten visual. Kemampuan ini membuat Veo 3 berbeda dari pesaingnya seperti Sora dari OpenAI, yang saat ini belum memiliki fitur generasi audio bawaan.
Bersamaan dengan Veo 3, Google juga meningkatkan model Veo 2 dengan sejumlah fitur baru yang kuat. Fitur-fitur tersebut meliputi video berbasis referensi untuk karakter dan objek yang konsisten, kontrol kamera canggih untuk pergerakan sinematik, outpainting untuk memperluas bingkai video di luar batas aslinya, serta kemampuan penambahan dan penghapusan objek secara cerdas.
Untuk menunjukkan potensi kreatif dari alat-alat ini, Google memperkenalkan Flow, sebuah platform pembuatan film AI baru yang menggabungkan model Veo, Imagen, dan Gemini. Sejumlah pembuat film telah menciptakan film pendek berkualitas profesional menggunakan teknologi ini, termasuk kisah fiksi ilmiah emosional "Kitsune" karya Henry Daubrez dan eksplorasi identitas berjudul "Dear Stranger" oleh Junie Lau.
Veo 3 saat ini tersedia untuk pelanggan AS yang berlangganan paket AI Ultra Google seharga $249,99 per bulan melalui aplikasi Gemini, serta untuk pengguna enterprise melalui platform Vertex AI milik Google. Teknologi ini juga dilengkapi watermark SynthID untuk membantu mengidentifikasi konten yang dihasilkan AI dan mengatasi kekhawatiran terkait deepfake serta misinformasi.