menu
close

Google Luncurkan Imagen 4 dengan Kemampuan Revolusioner dalam Rendering Teks

Google telah merilis Imagen 4, model AI text-to-image paling canggih hingga saat ini, yang tersedia untuk pengembang melalui Gemini API dan Google AI Studio mulai 15 Juli 2025. Iterasi terbaru ini menghadirkan peningkatan signifikan dalam kualitas gambar, terutama dalam kemampuan rendering teks, serta memperkenalkan dua varian model untuk memenuhi kebutuhan kreatif yang berbeda. Teknologi ini memungkinkan pengembang menghasilkan visual yang sangat detail dari deskripsi teks dengan aplikasi yang luas di bidang desain, pemasaran, hiburan, dan sektor kreatif lainnya.
Google Luncurkan Imagen 4 dengan Kemampuan Revolusioner dalam Rendering Teks

Google DeepMind secara resmi meluncurkan Imagen 4, model generasi gambar dari teks paling canggih yang pernah mereka kembangkan, menawarkan alat baru yang kuat bagi pengembang untuk menciptakan visual berbasis AI.

Peluncuran ini, yang tersedia mulai 15 Juli melalui Gemini API dan Google AI Studio, memperkenalkan dua model berbeda dalam keluarga Imagen 4. Model standar Imagen 4, dengan harga $0,04 per gambar output, menjadi andalan Google untuk berbagai tugas pembuatan gambar. Untuk aplikasi yang lebih menuntut dan membutuhkan ketepatan tinggi terhadap prompt teks, Imagen 4 Ultra menawarkan kapabilitas yang lebih unggul dengan harga $0,06 per gambar.

Imagen 4 merupakan lompatan besar dibanding pendahulunya, dengan Google menyoroti "kejernihan luar biasa pada detail halus" seperti kain rumit, tetesan air, dan bulu hewan. Model ini unggul dalam gaya fotorealistik maupun abstrak, mendukung berbagai rasio aspek dan resolusi hingga 2K.

Yang paling menonjol, Imagen 4 mengatasi tantangan lama dalam generasi gambar AI dengan peningkatan dramatis pada rendering teks. Peningkatan ini membuat teknologi sangat berharga untuk pembuatan materi pemasaran, poster, undangan, komik, dan visual lain yang menggabungkan gambar dengan teks.

"Imagen 4 adalah langkah besar dalam hal kualitas," ujar Josh Woodward, pemimpin grup Labs Google. "Kami sangat memperhatikan dan memperbaiki cara model ini menghasilkan teks dan tipografi, sehingga sangat cocok untuk membuat slide, undangan, atau kebutuhan lain yang memadukan gambar dan teks."

Integrasi teknologi ini ke dalam ekosistem Google, termasuk aplikasi Workspace, menempatkannya untuk meningkatkan produktivitas di berbagai alur kerja kreatif dan profesional. Google juga mengindikasikan akan menghadirkan tingkatan penagihan tambahan dalam beberapa minggu ke depan, dengan batas penggunaan lebih tinggi yang tersedia atas permintaan. Perusahaan juga berencana merilis varian Imagen 4 yang lebih cepat, yang diklaim dapat beroperasi hingga sepuluh kali lebih cepat dibanding Imagen 3.

Source:

Latest News