menu
close

Google Perkenal Imagen 4 dan Perluas Barisan Gemini 2.5

Google telah melancarkan Imagen 4, model penjanaan teks-ke-imej paling canggih setakat ini, kini tersedia dalam pratonton berbayar melalui Gemini API dan Google AI Studio. Pelancaran ini bertepatan dengan ketersediaan umum model Gemini 2.5 Flash dan Pro, serta pengenalan Gemini 2.5 Flash-Lite, model paling cekap kos dan terpantas dalam keluarga 2.5. Pembangun juga boleh mengakses Gemini terus dari terminal melalui Gemini CLI sumber terbuka yang baru diperkenalkan.
Google Perkenal Imagen 4 dan Perluas Barisan Gemini 2.5

Google telah memperluaskan keupayaan AI mereka secara signifikan dengan pelancaran Imagen 4, model penjanaan teks-ke-imej paling canggih, kini boleh didapati dalam pratonton berbayar melalui Gemini API dan Google AI Studio.

Imagen 4 mewakili peningkatan ketara berbanding versi terdahulu, khususnya dalam kualiti pemaparan teks dalam imej yang dijana. Pelancaran ini merangkumi dua varian: model standard Imagen 4 yang berharga $0.04 setiap imej yang dijana, dan Imagen 4 Ultra pada harga $0.06 setiap imej, yang menawarkan ketepatan lebih tinggi dalam mengikuti arahan pengguna. Kedua-dua model ini dilengkapi teknologi watermark SynthID yang tidak kelihatan oleh mata manusia tetapi membantu mengenal pasti kandungan yang dijana AI.

Pelancaran ini adalah sebahagian daripada pengembangan lebih luas keluarga model Gemini 2.5 oleh Google. Syarikat ini telah menjadikan Gemini 2.5 Flash dan Pro tersedia secara umum selepas tempoh pratonton yang berjaya, di samping memperkenalkan Gemini 2.5 Flash-Lite dalam pratonton. Flash-Lite diposisikan sebagai model 2.5 paling cekap kos dan terpantas Google, dioptimumkan untuk tugasan berskala besar dan sensitif kepada kependaman seperti klasifikasi, terjemahan, dan perutean pintar.

Walaupun memberi tumpuan kepada kecekapan, Gemini 2.5 Flash-Lite mengekalkan keupayaan utama keluarga 2.5, termasuk tetingkap konteks 1 juta token dan sokongan untuk alat asli seperti integrasi Google Search dan pelaksanaan kod. Tidak seperti model lain dalam keluarga ini yang mempunyai keupayaan berfikir diaktifkan secara lalai, Flash-Lite membolehkan pembangun mengawal bajet pemikiran melalui parameter API, dengan fungsi berfikir dimatikan secara lalai untuk mengoptimumkan kelajuan dan kos.

Bagi memperkukuh tawaran kepada pembangun, Google turut memperkenalkan Gemini CLI, agen AI sumber terbuka yang membawa Gemini terus ke terminal. Alat ini membolehkan pembangun mengakses Gemini 2.5 Pro melalui antara muka baris arahan untuk pengekodan, penyelesaian masalah, dan pengurusan tugasan. Sifat sumber terbuka Gemini CLI (di bawah lesen Apache 2.0) membolehkan pembangun memeriksa kod, mengesahkan implikasi keselamatan, dan menyumbang kepada pembangunannya.

Pelancaran AI terkini Google ini menunjukkan komitmen syarikat untuk menyediakan pembangun dengan alat yang semakin berkuasa dan fleksibel merentasi pelbagai titik harga dan kegunaan, daripada penjanaan imej berkualiti tinggi hingga pemprosesan teks yang cekap dan bantuan AI berasaskan terminal.

Source:

Latest News