Google Lancar Imagen 4 dengan Keupayaan Penjanaan Teks yang Revolusioner

Google telah melancarkan Imagen 4, model AI penjanaan imej daripada teks yang paling canggih setakat ini, dan kini boleh diakses oleh pembangun melalui Gemini API dan Google AI Studio bermula 15 Julai 2025. Versi terkini ini menawarkan peningkatan ketara dari segi kualiti imej, khususnya dalam keupayaan penjanaan teks, serta memperkenalkan dua varian model untuk memenuhi keperluan kreatif yang berbeza. Teknologi ini membolehkan pembangun menghasilkan visual yang sangat terperinci daripada deskripsi teks, dengan aplikasi meliputi reka bentuk, pemasaran, hiburan, dan pelbagai bidang kreatif lain.

Google DeepMind secara rasmi telah melancarkan Imagen 4, model penjanaan imej daripada teks yang paling canggih setakat ini, menawarkan pembangun alat baharu yang berkuasa untuk mencipta visual berasaskan AI.

Pelancaran ini, yang mula tersedia pada 15 Julai melalui Gemini API dan Google AI Studio, memperkenalkan dua model berbeza dalam keluarga Imagen 4. Model standard Imagen 4, yang ditawarkan pada harga $0.04 bagi setiap imej yang dijana, menjadi pilihan utama Google untuk pelbagai tugasan penjanaan imej. Untuk aplikasi yang memerlukan ketepatan tinggi terhadap arahan teks, Imagen 4 Ultra menawarkan keupayaan yang dipertingkatkan pada harga $0.06 bagi setiap imej.

Imagen 4 menandakan kemajuan besar berbanding model sebelumnya, dengan Google menekankan "kejelasan luar biasa pada butiran halus" seperti fabrik rumit, titisan air, dan bulu haiwan. Model ini cemerlang dalam gaya fotorealistik mahupun abstrak, menyokong pelbagai nisbah aspek dan resolusi sehingga 2K.

Paling ketara, Imagen 4 berjaya mengatasi cabaran utama dalam penjanaan imej AI dengan peningkatan dramatik dalam penjanaan teks. Penambahbaikan ini menjadikan teknologi ini sangat bernilai untuk menghasilkan bahan pemasaran, poster, jemputan, komik, dan visual lain yang menggabungkan imej serta teks.

"Imagen 4 adalah satu lonjakan besar dari segi kualiti," ujar Josh Woodward, ketua kumpulan Labs Google. "Kami memberi perhatian dan penambahbaikan khusus pada cara ia menjana teks dan tipografi, jadi ia sangat sesuai untuk mencipta slaid atau jemputan, atau apa-apa sahaja yang memerlukan gabungan imej dan teks."

Integrasi teknologi ini ke dalam ekosistem Google, termasuk aplikasi Workspace, meletakkannya sebagai alat yang dapat meningkatkan produktiviti dalam pelbagai aliran kerja kreatif dan profesional. Google turut memaklumkan bahawa lebih banyak pilihan pengebilan akan diperkenalkan dalam beberapa minggu akan datang, dengan had kadar penggunaan yang lebih tinggi boleh dimohon. Syarikat itu juga merancang untuk melancarkan varian Imagen 4 yang lebih pantas, berpotensi beroperasi sehingga sepuluh kali ganda lebih laju berbanding Imagen 3.

Source:

Google Lancar Imagen 4 dengan Keupayaan Penjanaan Teks yang Revolusioner

Latest News

Google Perkenal Gemini 2.5 Flash-Lite Ultra-Efisyen untuk AI Sensitif Kos

Google Lancar Gemini CLI: Pembantu AI untuk Terminal Pembangun

Revolusi Penjagaan Kanser oleh Google AI dengan Alat Pengesanan Terobosan

AI Dalam-Peranti Google Membawa Kecerdasan Autonomi kepada Robot

Syarikat Kekurangan Kemahiran Insaniah Kritikal untuk Kejayaan Era AI

VentureBeat Dedah Perubahan Besar Pasaran AI dalam Analisis 2025

GPT-5 OpenAI Bakal Satukan Keupayaan AI Dalam Satu Model Berkuasa

Pertaruhan AI Meta Bernilai $14.8B: Tindakan Terdesak atau Kejenius Strategik?

Gergasi Teknologi Beralih kepada Tenaga Nuklear untuk Memenuhi Permintaan Tenaga AI

Dailymotion Memperkenalkan Revolusi Platform Video Dipacu AI

Google Lancar Imagen 4 dengan Keupayaan Penjanaan Teks yang Revolusioner

Related Articles

AI Dalam-Peranti Google Membawa Kecerdasan Autonomi kepada Robot

Google Lancar Gemini CLI: Pembantu AI untuk Terminal Pembangun

Google Perkenal Gemini 2.5 Flash-Lite Ultra-Efisyen untuk AI Sensitif Kos

Kimi K2 dengan Satu Trilion Parameter dari Moonshot AI Cabar Gergasi AI

Google Memperluas Gemini Live dengan Integrasi Aplikasi yang Lebih Mendalam

Latest News

Google Perkenal Gemini 2.5 Flash-Lite Ultra-Efisyen untuk AI Sensitif Kos

Google Lancar Gemini CLI: Pembantu AI untuk Terminal Pembangun

Revolusi Penjagaan Kanser oleh Google AI dengan Alat Pengesanan Terobosan

AI Dalam-Peranti Google Membawa Kecerdasan Autonomi kepada Robot

Syarikat Kekurangan Kemahiran Insaniah Kritikal untuk Kejayaan Era AI

VentureBeat Dedah Perubahan Besar Pasaran AI dalam Analisis 2025

GPT-5 OpenAI Bakal Satukan Keupayaan AI Dalam Satu Model Berkuasa

Pertaruhan AI Meta Bernilai $14.8B: Tindakan Terdesak atau Kejenius Strategik?

Gergasi Teknologi Beralih kepada Tenaga Nuklear untuk Memenuhi Permintaan Tenaga AI

Dailymotion Memperkenalkan Revolusi Platform Video Dipacu AI