Google diam-diam namun secara signifikan telah meningkatkan model Imagen 4 Ultra, menjadikannya salah satu sistem generasi gambar AI terdepan di dunia. Model yang telah disempurnakan ini kini menempati posisi ketiga di papan peringkat Image Arena milik Artificial Analysis, menempatkannya sebagai pesaing langsung para pemimpin industri seperti GPT-4o dari OpenAI dan Seedream 3.0 dari ByteDance.
Pertama kali diperkenalkan pada Google I/O 2025 di bulan Mei, Imagen 4 Ultra merupakan lompatan besar dibanding pendahulunya. Model ini sangat unggul dalam merender detail rumit seperti tekstur kain, tetesan air, dan bulu hewan dengan kejernihan luar biasa. Pengguna melaporkan peningkatan signifikan baik pada gaya gambar fotorealistik maupun abstrak, dengan kemampuan menghasilkan gambar hingga resolusi 2K.
Salah satu peningkatan paling menonjol dari Imagen 4 Ultra adalah kemampuannya dalam merender teks—sebuah tantangan lama dalam generasi gambar AI. Model ini menunjukkan kemampuan tipografi yang jauh lebih baik, sehingga sangat berguna untuk membuat kartu ucapan, poster, dan desain lain yang menggabungkan gambar dengan teks.
Google telah menyediakan Imagen 4 Ultra melalui berbagai saluran, termasuk aplikasi Gemini, Google AI Studio, dan Vertex AI untuk pelanggan korporat. Dengan harga $0,06 per gambar output, model ini menawarkan struktur harga yang kompetitif dibandingkan GPT-4o yang sekitar $0,17 per gambar, serta menghasilkan gambar dalam waktu sekitar 9,5 detik—jauh lebih cepat dari GPT-4o yang membutuhkan 53 detik.
Peningkatan ini menandakan tekad Google untuk bersaing di level tertinggi dalam ranah AI generatif. Menurut para analis industri, upaya berkelanjutan Google DeepMind dalam menyempurnakan keluarga Imagen menunjukkan komitmen perusahaan untuk mendorong batas kemampuan konten visual yang dihasilkan AI.
Ke depan, Google menyatakan bahwa pembaruan berikutnya untuk Imagen 4 Ultra akan berfokus pada integrasi masukan pengguna guna semakin menyempurnakan kemampuan model, sekaligus mengurangi latensi generasi. Perusahaan juga tengah mengembangkan versi "Fast" dari Imagen 4 yang diklaim hingga 10 kali lebih cepat dari Imagen 3, sehingga semakin meningkatkan kegunaannya untuk aplikasi waktu nyata.