menu
close

Google Perluas Kontrol Biaya AI ke Gemini 2.5 Pro

Google telah memperluas fitur 'thinking budgets' dari Gemini 2.5 Flash ke Gemini 2.5 Pro, memberikan pengembang kontrol yang lebih presisi atas biaya penalaran AI. Fitur ini memungkinkan pengguna membatasi jumlah token yang digunakan model untuk penalaran atau menonaktifkan fungsi berpikir sepenuhnya, sehingga dapat menyeimbangkan performa dengan efisiensi ekonomi. Fitur ini menjawab tantangan penting bagi bisnis yang menerapkan AI canggih dalam skala besar, karena kemampuan penalaran biasanya disertai biaya operasional yang jauh lebih tinggi.
Google Perluas Kontrol Biaya AI ke Gemini 2.5 Pro

Google mengumumkan perluasan fitur inovatif 'thinking budgets' ke Gemini 2.5 Pro, model penalaran AI paling canggih milik perusahaan, setelah implementasi sukses di Gemini 2.5 Flash awal tahun ini.

Fitur thinking budgets merupakan kemajuan signifikan dalam pengelolaan biaya AI, memungkinkan pengembang mengontrol secara presisi seberapa banyak daya komputasi yang dialokasikan untuk penalaran masalah kompleks. Dengan kemampuan ini, pengguna dapat menentukan jumlah maksimum token yang digunakan model untuk penalaran internal sebelum menghasilkan respons, atau bahkan mematikan kemampuan berpikir sepenuhnya untuk tugas-tugas yang lebih sederhana.

"Kami meluncurkan 2.5 Flash dengan thinking budgets untuk memberikan pengembang kontrol lebih atas biaya dengan menyeimbangkan latensi dan kualitas. Dan kami memperluas kemampuan ini ke 2.5 Pro," ujar Google dalam pengumumannya. Perusahaan mengonfirmasi bahwa Gemini 2.5 Pro dengan fitur budgets akan tersedia secara umum untuk penggunaan produksi stabil dalam beberapa minggu mendatang.

Pengembangan ini menjawab ketegangan mendasar di pasar AI saat ini, di mana penalaran yang lebih canggih biasanya meningkatkan latensi dan biaya. Sebagai contoh, pada Gemini 2.5 Flash, mengaktifkan penalaran meningkatkan biaya output hampir enam kali lipat—dari $0,60 menjadi $3,50 per satu juta token. Dengan menerapkan thinking budgets, bisnis dapat mengoptimalkan penerapan AI mereka berdasarkan kebutuhan spesifik, mengaktifkan penalaran hanya saat diperlukan.

Fitur ini sangat berharga bagi pelanggan korporasi yang perlu mengelola biaya penerapan AI dengan cermat, namun tetap ingin mengakses kapabilitas tingkat lanjut. Untuk permintaan sederhana seperti terjemahan bahasa atau pengambilan informasi dasar, fungsi berpikir dapat dinonaktifkan demi efisiensi biaya maksimal. Untuk tugas kompleks yang memerlukan penalaran bertahap, seperti pemecahan masalah matematika atau analisis mendalam, fungsi berpikir dapat diaktifkan dan disesuaikan.

Seiring AI semakin terintegrasi dalam alur kerja bisnis, pendekatan Google dengan penalaran yang dapat dikustomisasi mencerminkan pasar yang semakin matang, di mana optimasi biaya dan penyesuaian performa menjadi sama pentingnya dengan kemampuan mentah—menandai fase baru dalam komersialisasi teknologi AI generatif.

Source:

Latest News