Google, 20 Mayıs 2025’te düzenlenen yıllık I/O geliştirici konferansında Veo 3 ve Imagen 4’ün lansmanıyla yapay zekâ tabanlı medya üretim yeteneklerinde önemli bir sıçrama gerçekleştirdi.
Google’ın en yeni video üretim modeli olan Veo 3, ilk kez ses üretimi yeteneğiyle büyük bir ilerlemeye imza atıyor. Model, trafik gürültüsü veya kuş cıvıltısı gibi arka plan sesleriyle senkronize edilmiş videolar oluşturabiliyor ve karakterler arasında doğru dudak senkronizasyonuyla diyaloglar üretebiliyor. Veo 3, gerçek dünya fiziği ve insan ifadelerini daha iyi kavrayarak daha gerçekçi ve detaylı video çıktıları sunuyor.
Veo 3’ün yanı sıra Google, bugüne kadarki en gelişmiş görsel üretim modeli olan Imagen 4’ü de tanıttı. Imagen 4; karmaşık kumaşlar, su damlaları ve hayvan tüyleri gibi ince detayları olağanüstü netlikle işleyebiliyor. Model, farklı en-boy oranlarını destekliyor ve 2K çözünürlüğe kadar görseller üretebiliyor; bu da onu baskı veya sunumlar için ideal kılıyor. Google ayrıca, Imagen 4’ün önceki sürümünden 10 kata kadar daha hızlı olacak "hızlı varyantını" da duyurdu. Bu varyant, hızlı prototipleme ve yaratıcı iş akışları için optimize edildi.
Bu güçlü yapay zekâ modelleri, Google’ın yeni yapay zekâ destekli film yapım aracı Flow’un temelini oluşturuyor. Flow; Veo, Imagen ve Gemini’nin yeteneklerini bir araya getirerek hikâye anlatıcılarının sinematik klipler ve sahneler oluşturmasına yardımcı oluyor. Araç; hassas kamera hareketleri için Kamera Kontrolleri, çekimleri sorunsuzca uzatmak için SceneBuilder ve yaratıcı ögeleri düzenlemek için Varlık Yönetimi gibi özellikler sunuyor. Flow, içerik üreticilerinin birden fazla klipte tutarlı karakterler ve sahneler oluşturmasına olanak tanıyarak daha bütünlüklü bir hikâye anlatımı deneyimi sağlıyor.
Veo 3 şu anda ABD’de Google AI Ultra abonelerine aylık 249,99 dolar fiyatla sunulurken, Imagen 4 ise Gemini uygulaması, Whisk, Vertex AI ve çeşitli Google Workspace uygulamaları üzerinden erişilebiliyor. Bu modellerle üretilen tüm içeriklerde, şeffaflık sağlamak ve yanlış bilgilendirmeyle mücadele etmek amacıyla SynthID filigranları bulunuyor.
Bu gelişmeler, Google’ın yapay zekâ yeteneklerini daha fazla kullanıcıya ulaştırma kararlılığını yansıtıyor. Şirket ayrıca, Gemini uygulamalarının aylık 400 milyondan fazla aktif kullanıcıya ulaştığını duyurarak yapay zekâ teknolojilerinin hızla benimsendiğini gösterdi.