Google secara resmi meluncurkan Gemini 2.5 Flash-Lite, menandai kemajuan signifikan dalam menghadirkan AI yang kuat menjadi lebih mudah diakses dan efisien bagi pengembang serta perusahaan.
Model baru ini, yang digambarkan sebagai "model 2.5 paling efisien dan tercepat dari Google hingga saat ini", dioptimalkan untuk operasi dengan volume tinggi dan sensitif terhadap latensi. Flash-Lite hadir di pasar dengan latensi dan biaya terendah dalam keluarga model 2.5, dirancang sebagai peningkatan hemat biaya dari model Flash 1.5 dan 2.0 sebelumnya. Model ini menawarkan performa lebih baik di sebagian besar evaluasi, dengan waktu ke token pertama yang lebih rendah serta kecepatan decode token per detik yang lebih tinggi, menjadikannya ideal untuk tugas throughput tinggi seperti klasifikasi atau rangkuman dalam skala besar.
Sebagai model penalaran, Flash-Lite memungkinkan kontrol dinamis atas anggaran berpikir melalui parameter API. Berbeda dengan model Gemini 2.5 lain yang fitur penalarannya aktif secara default, Flash-Lite dioptimalkan untuk biaya dan kecepatan dengan menjaga fitur berpikir tetap nonaktif kecuali diaktifkan secara spesifik. Meski demikian, Flash-Lite tetap mendukung semua alat native termasuk Google Search grounding, eksekusi kode, konteks URL, dan pemanggilan fungsi.
Pengujian performa menunjukkan Flash-Lite 1,5 kali lebih cepat dari Gemini 2.0 Flash dengan biaya lebih rendah, sehingga sangat cocok untuk tugas seperti klasifikasi, penerjemahan, routing cerdas, dan operasi berskala besar yang sensitif terhadap biaya. Sementara model lain mungkin secara default menggunakan alat penalaran yang lebih kuat (dan mahal) untuk menjawab pertanyaan, Flash-Lite memberi pengembang kendali atas proses ini. Pengguna dapat mengaktifkan atau menonaktifkan kemampuan berpikir sesuai kebutuhan spesifik, dan meskipun hemat biaya, Flash-Lite tidak terbatas pada apa yang dapat dicapai.
Pratinjau Gemini 2.5 Flash-Lite kini tersedia di Google AI Studio dan Vertex AI, bersama versi stabil 2.5 Flash dan Pro. Baik 2.5 Flash maupun Pro juga dapat diakses di aplikasi Gemini, dan Google telah menghadirkan versi kustom 2.5 Flash-Lite dan Flash ke Search.
Ekspansi strategis keluarga model Gemini ini menunjukkan komitmen Google untuk mendemokratisasi AI dengan menyediakan pilihan yang menyeimbangkan performa, biaya, dan kecepatan untuk berbagai kasus penggunaan, mulai dari tugas penalaran kompleks hingga pemrosesan data dalam volume besar.