Google mengumumkan bahwa Gemini 2.5 Flash dan 2.5 Pro kini telah stabil dan tersedia secara umum, memberikan keandalan dan skalabilitas yang dibutuhkan organisasi untuk menerapkan kemampuan AI canggih ke aplikasi penting mereka dengan percaya diri. Bersamaan dengan peluncuran ini, perusahaan juga memperkenalkan Gemini 2.5 Flash-Lite dalam versi pratinjau, yang digambarkan sebagai model 2.5 mereka yang paling hemat biaya dan tercepat hingga saat ini.
Gemini 2.5 Flash-Lite adalah model reasoning yang memungkinkan kontrol dinamis terhadap "thinking budget" melalui parameter API. Berbeda dengan model lain di keluarga 2.5, Flash-Lite dioptimalkan untuk biaya dan kecepatan dengan "thinking" dinonaktifkan secara default. Meski demikian, model ini tetap mendukung semua alat native termasuk Grounding dengan Google Search, Eksekusi Kode, dan Konteks URL selain pemanggilan fungsi.
Flash-Lite menawarkan performa lebih tinggi dibandingkan model Flash-Lite sebelumnya dan 1,5 kali lebih cepat dari 2.0 Flash dengan biaya lebih rendah. Model ini dirancang khusus untuk tugas berskala besar dan sensitif terhadap latensi seperti terjemahan, klasifikasi, perutean cerdas, serta operasi lain yang membutuhkan efisiensi biaya dan skala tinggi. Model ini juga menunjukkan performa jauh lebih baik dibandingkan 2.0 Flash-Lite pada tolok ukur pengkodean, matematika, sains, reasoning, dan multimodal, sehingga sangat ideal untuk tugas-tugas berskala besar.
Seperti model lain di keluarga Gemini 2.5, Flash-Lite hadir dengan fitur-fitur yang membuatnya bermanfaat, termasuk kemampuan mengaktifkan "thinking" pada berbagai tingkat budget, terhubung ke alat seperti Grounding dengan Google Search dan eksekusi kode, input multimodal, serta konteks hingga 1 juta token. Untuk memastikan respons yang aktual dan faktual, Flash-Lite dapat menggunakan Google Search sebagai alat bawaan, secara cerdas memutuskan kapan harus menggunakan Search untuk memperkaya pengetahuannya.
Selain peluncuran Flash-Lite, Google juga mengumumkan bahwa Gemini 2.5 Pro telah menjadi model terdepan di dunia di papan peringkat WebDev Arena dan LMArena. Dengan skor ELO 1415 di papan peringkat coding WebDev Arena, model ini memimpin di semua papan peringkat LMArena, yang mengukur preferensi manusia dalam berbagai dimensi.
Selain itu, Google telah mengintegrasikan LearnLM langsung ke Gemini 2.5, menjadikannya model terdepan di dunia untuk pembelajaran. Berdasarkan laporan terbaru mereka, Gemini 2.5 Pro mengungguli pesaing di setiap kategori prinsip ilmu pembelajaran, dengan para pendidik dan pakar pedagogi lebih memilihnya dibandingkan penawaran lain di berbagai skenario pembelajaran.
Gemini 2.5 Flash-Lite kini tersedia dalam versi pratinjau di Google AI Studio dan Vertex AI, bersama versi stabil 2.5 Flash dan Pro. Pengembang dapat mengakses model (gemini-2.5-flash-lite-preview-06-17) melalui Google Gen AI SDK, yang menyediakan antarmuka terpadu ke keluarga model Gemini 2.5 baik melalui Gemini Developer API maupun Vertex AI Gemini API.