Google mengumumkan perluasan fitur inovatif 'thinking budgets' ke Gemini 2.5 Pro, model penalaran AI paling canggih milik perusahaan, setelah implementasi sukses di Gemini 2.5 Flash awal tahun ini.
Fitur thinking budgets merupakan kemajuan signifikan dalam pengelolaan biaya AI, memungkinkan pengembang mengontrol secara presisi seberapa banyak daya komputasi yang dialokasikan untuk penalaran masalah kompleks. Dengan kemampuan ini, pengguna dapat menentukan jumlah maksimum token yang digunakan model untuk penalaran internal sebelum menghasilkan respons, atau bahkan mematikan kemampuan berpikir sepenuhnya untuk tugas-tugas yang lebih sederhana.
"Kami meluncurkan 2.5 Flash dengan thinking budgets untuk memberikan pengembang kontrol lebih atas biaya dengan menyeimbangkan latensi dan kualitas. Dan kami memperluas kemampuan ini ke 2.5 Pro," ujar Google dalam pengumumannya. Perusahaan mengonfirmasi bahwa Gemini 2.5 Pro dengan fitur budgets akan tersedia secara umum untuk penggunaan produksi stabil dalam beberapa minggu mendatang.
Pengembangan ini menjawab ketegangan mendasar di pasar AI saat ini, di mana penalaran yang lebih canggih biasanya meningkatkan latensi dan biaya. Sebagai contoh, pada Gemini 2.5 Flash, mengaktifkan penalaran meningkatkan biaya output hampir enam kali lipat—dari $0,60 menjadi $3,50 per satu juta token. Dengan menerapkan thinking budgets, bisnis dapat mengoptimalkan penerapan AI mereka berdasarkan kebutuhan spesifik, mengaktifkan penalaran hanya saat diperlukan.
Fitur ini sangat berharga bagi pelanggan korporasi yang perlu mengelola biaya penerapan AI dengan cermat, namun tetap ingin mengakses kapabilitas tingkat lanjut. Untuk permintaan sederhana seperti terjemahan bahasa atau pengambilan informasi dasar, fungsi berpikir dapat dinonaktifkan demi efisiensi biaya maksimal. Untuk tugas kompleks yang memerlukan penalaran bertahap, seperti pemecahan masalah matematika atau analisis mendalam, fungsi berpikir dapat diaktifkan dan disesuaikan.
Seiring AI semakin terintegrasi dalam alur kerja bisnis, pendekatan Google dengan penalaran yang dapat dikustomisasi mencerminkan pasar yang semakin matang, di mana optimasi biaya dan penyesuaian performa menjadi sama pentingnya dengan kemampuan mentah—menandai fase baru dalam komersialisasi teknologi AI generatif.