menu
close

Google Luncurkan Imagen 4 dan Perluas Lini Gemini 2.5

Google telah merilis Imagen 4, model text-to-image tercanggihnya hingga saat ini, yang kini tersedia dalam pratinjau berbayar melalui Gemini API dan Google AI Studio. Peluncuran ini bertepatan dengan ketersediaan umum model Gemini 2.5 Flash dan Pro, serta pengenalan Gemini 2.5 Flash-Lite, model paling efisien dan tercepat dalam keluarga 2.5. Pengembang juga dapat mengakses Gemini langsung dari terminal melalui Gemini CLI open-source yang baru dirilis.
Google Luncurkan Imagen 4 dan Perluas Lini Gemini 2.5

Google secara signifikan memperluas kapabilitas AI-nya dengan merilis Imagen 4, model generasi gambar dari teks paling canggih milik mereka, yang kini tersedia dalam pratinjau berbayar melalui Gemini API dan Google AI Studio.

Imagen 4 menghadirkan peningkatan besar dibanding versi sebelumnya, terutama dalam kualitas rendering teks pada gambar yang dihasilkan. Rilis ini mencakup dua varian: model standar Imagen 4 dengan harga $0,04 per gambar output, dan Imagen 4 Ultra seharga $0,06 per gambar, yang menawarkan presisi lebih tinggi dalam mengikuti instruksi pengguna. Kedua model ini dilengkapi teknologi watermark SynthID yang tak kasat mata namun membantu mengidentifikasi konten yang dihasilkan AI.

Peluncuran ini merupakan bagian dari ekspansi besar keluarga model Gemini 2.5 milik Google. Perusahaan telah membuat Gemini 2.5 Flash dan Pro tersedia secara umum setelah masa pratinjau yang sukses, sekaligus memperkenalkan Gemini 2.5 Flash-Lite dalam tahap pratinjau. Flash-Lite diposisikan sebagai model 2.5 paling efisien dan tercepat dari Google, dioptimalkan untuk tugas dengan volume tinggi dan sensitif terhadap latensi seperti klasifikasi, penerjemahan, dan routing cerdas.

Meski fokus pada efisiensi, Gemini 2.5 Flash-Lite tetap mempertahankan kemampuan utama keluarga 2.5, termasuk context window hingga 1 juta token dan dukungan untuk alat native seperti integrasi Google Search dan eksekusi kode. Berbeda dengan model lain di keluarga ini yang fitur "thinking"-nya aktif secara default, Flash-Lite memungkinkan pengembang mengatur anggaran thinking melalui parameter API, dengan thinking nonaktif secara default demi mengoptimalkan kecepatan dan biaya.

Untuk semakin memperkuat penawaran bagi pengembang, Google juga merilis Gemini CLI, agen AI open-source yang membawa Gemini langsung ke terminal. Alat ini memungkinkan pengembang mengakses Gemini 2.5 Pro lewat antarmuka command-line untuk kebutuhan coding, pemecahan masalah, dan manajemen tugas. Sifat open-source Gemini CLI (di bawah lisensi Apache 2.0) memungkinkan pengembang memeriksa kode, memverifikasi aspek keamanan, serta berkontribusi pada pengembangannya.

Rangkaian rilis AI terbaru dari Google ini menunjukkan komitmen perusahaan dalam menyediakan alat yang makin kuat dan fleksibel bagi pengembang di berbagai titik harga dan kebutuhan, mulai dari generasi gambar berkualitas tinggi, pemrosesan teks efisien, hingga asisten AI berbasis terminal.

Source:

Latest News