Google DeepMind secara resmi meluncurkan Imagen 4, model generasi gambar dari teks paling canggih yang pernah mereka kembangkan, menawarkan alat baru yang kuat bagi pengembang untuk menciptakan visual berbasis AI.
Peluncuran ini, yang tersedia mulai 15 Juli melalui Gemini API dan Google AI Studio, memperkenalkan dua model berbeda dalam keluarga Imagen 4. Model standar Imagen 4, dengan harga $0,04 per gambar output, menjadi andalan Google untuk berbagai tugas pembuatan gambar. Untuk aplikasi yang lebih menuntut dan membutuhkan ketepatan tinggi terhadap prompt teks, Imagen 4 Ultra menawarkan kapabilitas yang lebih unggul dengan harga $0,06 per gambar.
Imagen 4 merupakan lompatan besar dibanding pendahulunya, dengan Google menyoroti "kejernihan luar biasa pada detail halus" seperti kain rumit, tetesan air, dan bulu hewan. Model ini unggul dalam gaya fotorealistik maupun abstrak, mendukung berbagai rasio aspek dan resolusi hingga 2K.
Yang paling menonjol, Imagen 4 mengatasi tantangan lama dalam generasi gambar AI dengan peningkatan dramatis pada rendering teks. Peningkatan ini membuat teknologi sangat berharga untuk pembuatan materi pemasaran, poster, undangan, komik, dan visual lain yang menggabungkan gambar dengan teks.
"Imagen 4 adalah langkah besar dalam hal kualitas," ujar Josh Woodward, pemimpin grup Labs Google. "Kami sangat memperhatikan dan memperbaiki cara model ini menghasilkan teks dan tipografi, sehingga sangat cocok untuk membuat slide, undangan, atau kebutuhan lain yang memadukan gambar dan teks."
Integrasi teknologi ini ke dalam ekosistem Google, termasuk aplikasi Workspace, menempatkannya untuk meningkatkan produktivitas di berbagai alur kerja kreatif dan profesional. Google juga mengindikasikan akan menghadirkan tingkatan penagihan tambahan dalam beberapa minggu ke depan, dengan batas penggunaan lebih tinggi yang tersedia atas permintaan. Perusahaan juga berencana merilis varian Imagen 4 yang lebih cepat, yang diklaim dapat beroperasi hingga sepuluh kali lebih cepat dibanding Imagen 3.