Google telah melancarkan versi pratonton Gemini 2.5 Flash, iterasi terkini model AI cekap mereka yang direka untuk mengimbangi prestasi dengan kelajuan dan keberkesanan kos.
Berdasarkan asas Gemini 2.0 Flash, model 2.5 Flash baharu ini menawarkan peningkatan besar dalam keupayaan penaakulan sambil mengekalkan reputasinya sebagai model yang cekap. Google menggambarkannya sebagai "peningkatan besar dalam keupayaan penaakulan, namun masih mengutamakan kelajuan dan kos."
Ciri utama Gemini 2.5 Flash ialah sistem penaakulan hibridnya. Ia merupakan "model penaakulan hibrid sepenuhnya pertama Google, membolehkan pembangun menghidupkan atau mematikan proses pemikiran, serta menetapkan bajet pemikiran untuk mengoptimumkan keseimbangan antara kualiti, kos dan kependaman." Pendekatan inovatif ini memberikan kawalan yang belum pernah ada sebelum ini kepada pembangun dalam cara model memproses tugasan kompleks.
Dalam praktiknya, ini bermakna pembangun boleh menetapkan "bajet pemikiran" yang mengawal sejauh mana model melakukan penaakulan. Mereka boleh melaras "bilangan token yang boleh dijana model semasa berfikir" dari 0 hingga 24,576 token menggunakan peluncur di Google AI Studio dan Vertex AI, atau melalui parameter API. Apabila bajet pemikiran ditetapkan kepada sifar, kos dan kependaman model adalah sama seperti Gemini 2.0 Flash.
Struktur harga mencerminkan fleksibiliti ini, dengan token input berharga 15 sen bagi setiap sejuta dan token output 60 sen bagi setiap sejuta tanpa penaakulan. Dengan keupayaan pemikiran diaktifkan, kos meningkat kepada $3.50 bagi setiap sejuta token.
Ujian penanda aras menunjukkan keputusan yang mengagumkan. Gemini 2.5 Flash "berprestasi tinggi pada Hard Prompts di LMArena, kedua selepas 2.5 Pro" dan "mempunyai metrik setanding dengan model terkemuka lain pada sebahagian kecil kos dan saiz," terus "mendahului sebagai model dengan nisbah harga-ke-prestasi terbaik."
Google menyifatkan 2.5 Flash sebagai "model kerja paling cekap mereka yang direka untuk kelajuan dan kos rendah," serta menyatakan ia "telah bertambah baik dalam penanda aras utama untuk penaakulan, multimodaliti, kod dan konteks panjang sambil menjadi lebih cekap, menggunakan 20-30% kurang token" dalam penilaian.
Model baharu ini kini tersedia dalam mod pratonton melalui pelbagai saluran. Ia sedang dilancarkan "di Google AI Studio (pembangun), Vertex AI (perusahaan), dan aplikasi Gemini (semua orang)." Menurut pengumuman Google I/O 2025, versi terkini ini akan "tersedia secara umum di Google AI Studio untuk pembangun dan di Vertex AI untuk perusahaan pada awal Jun," dengan Gemini 2.5 Pro menyusul "tidak lama selepas itu."
Ketika Google terus memperluaskan keupayaan AI mereka, Gemini 2.5 Flash mewakili langkah besar ke hadapan dalam menjadikan penaakulan lanjutan lebih mudah diakses dan menjimatkan kos untuk pembangun serta pengguna.