Google secara rasmi telah melancarkan Gemini 2.5 Flash-Lite, menandakan kemajuan penting dalam usaha menjadikan AI berkuasa lebih mudah diakses dan efisien untuk pembangun serta perusahaan.
Model baharu ini, yang digambarkan sebagai "model 2.5 paling efisien kos dan terpantas" oleh Google, dioptimumkan untuk operasi berjumlah besar dan sensitif kependaman. Flash-Lite memasuki pasaran dengan kependaman dan kos terendah dalam keluarga model 2.5, direka sebagai naik taraf berpatutan daripada model Flash 1.5 dan 2.0 sebelum ini. Ia menawarkan prestasi lebih baik dalam kebanyakan penilaian, dengan masa ke token pertama yang lebih rendah serta kadar penyahkodan token per saat yang lebih tinggi, menjadikannya ideal untuk tugasan berintensiti tinggi seperti pengelasan atau penringkasan berskala besar.
Sebagai model penaakulan, Flash-Lite membolehkan kawalan dinamik terhadap bajet pemikiran melalui parameter API. Tidak seperti model Gemini 2.5 lain yang mengaktifkan pemikiran secara lalai, Flash-Lite dioptimumkan untuk kos dan kelajuan dengan mematikan fungsi pemikiran melainkan diaktifkan secara khusus. Walaupun dioptimumkan sebegitu, ia tetap menyokong semua alat asli termasuk pengesahan Google Search, pelaksanaan kod, konteks URL, dan pemanggilan fungsi.
Ujian prestasi menunjukkan Flash-Lite adalah 1.5 kali lebih pantas daripada Gemini 2.0 Flash pada kos yang lebih rendah, menjadikannya sangat sesuai untuk tugasan seperti pengelasan, penterjemahan, penghalaan pintar, dan operasi berskala besar yang sensitif terhadap kos. Walaupun model lain mungkin menggunakan alat penaakulan yang lebih berkuasa (dan mahal) secara lalai untuk menjawab soalan, Flash-Lite memberikan kawalan kepada pembangun terhadap proses ini. Pengguna boleh mengaktifkan atau mematikan keupayaan pemikiran mengikut keperluan khusus, dan walaupun sangat efisien dari segi kos, Flash-Lite tidak terhad dalam keupayaannya.
Pratonton Gemini 2.5 Flash-Lite kini boleh didapati di Google AI Studio dan Vertex AI, bersama versi stabil 2.5 Flash dan Pro. Kedua-dua 2.5 Flash dan Pro juga boleh diakses dalam aplikasi Gemini, dan Google turut membawa versi tersuai 2.5 Flash-Lite dan Flash ke Search.
Pengembangan strategik keluarga model Gemini ini menunjukkan komitmen Google untuk mendemokrasikan AI dengan menyediakan pilihan yang seimbang dari segi prestasi, kos, dan kelajuan untuk pelbagai kegunaan, daripada tugasan penaakulan kompleks hingga pemprosesan data berjumlah besar.