Google telah meluncurkan versi pratinjau Gemini 2.5 Flash, iterasi terbaru dari model AI efisien yang dirancang untuk menyeimbangkan performa dengan kecepatan dan efektivitas biaya.
Berdasarkan fondasi Gemini 2.0 Flash, model 2.5 Flash yang baru ini menghadirkan peningkatan besar dalam kemampuan penalaran sambil tetap mempertahankan reputasinya dalam hal efisiensi. Google menyebutnya sebagai "peningkatan besar dalam kemampuan penalaran, namun tetap mengutamakan kecepatan dan biaya."
Fitur unggulan dari Gemini 2.5 Flash adalah sistem penalaran hibridanya. Ini adalah "model penalaran hibrida penuh pertama dari Google, yang memungkinkan pengembang mengaktifkan atau menonaktifkan proses berpikir, serta mengatur anggaran berpikir untuk mengoptimalkan keseimbangan antara kualitas, biaya, dan latensi." Pendekatan inovatif ini memberikan kontrol yang belum pernah ada sebelumnya bagi pengembang atas cara model memproses tugas-tugas kompleks.
Dalam praktiknya, ini berarti pengembang dapat menentukan "anggaran berpikir" yang mengatur seberapa banyak penalaran yang dilakukan model. Mereka dapat menyesuaikan "jumlah token yang dapat dihasilkan model saat berpikir" dari 0 hingga 24.576 token menggunakan penggeser di Google AI Studio dan Vertex AI, atau melalui parameter API. Ketika anggaran berpikir diatur ke nol, biaya dan latensi model akan sama dengan Gemini 2.0 Flash.
Harga mencerminkan fleksibilitas ini, dengan token input seharga 15 sen per juta dan token output 60 sen per juta tanpa penalaran. Jika kemampuan berpikir diaktifkan, biayanya meningkat menjadi $3,50 per juta token.
Pengujian benchmark menunjukkan hasil yang mengesankan. Gemini 2.5 Flash "berkinerja sangat baik pada Hard Prompts di LMArena, hanya kalah dari 2.5 Pro" dan "memiliki metrik yang sebanding dengan model terkemuka lainnya dengan biaya dan ukuran yang jauh lebih kecil," serta "terus memimpin sebagai model dengan rasio harga terhadap performa terbaik."
Google menggambarkan 2.5 Flash sebagai "model andalan paling efisien yang dirancang untuk kecepatan dan biaya rendah," serta mencatat bahwa model ini "mengalami peningkatan di berbagai tolok ukur utama untuk penalaran, multimodalitas, kode, dan konteks panjang, sambil menjadi lebih efisien dengan penggunaan token 20-30% lebih sedikit" dalam evaluasi.
Model baru ini saat ini tersedia dalam mode pratinjau melalui berbagai saluran. Model ini diluncurkan "di Google AI Studio (pengembang), Vertex AI (perusahaan), dan aplikasi Gemini (untuk semua pengguna)." Menurut pengumuman Google I/O 2025, versi terbaru ini akan "tersedia secara umum di Google AI Studio untuk pengembang dan di Vertex AI untuk perusahaan pada awal Juni," dengan Gemini 2.5 Pro menyusul "tidak lama setelahnya."
Seiring Google terus memperluas kemampuan AI-nya, Gemini 2.5 Flash menjadi langkah maju yang signifikan dalam menghadirkan penalaran canggih yang lebih mudah diakses dan hemat biaya bagi pengembang maupun pengguna.