menu
close

Google Meluaskan Kawalan Kos AI ke Gemini 2.5 Pro

Google telah memperluaskan ciri 'bajet pemikiran' daripada Gemini 2.5 Flash ke Gemini 2.5 Pro, memberikan pembangun kawalan tepat ke atas kos penaakulan AI. Keupayaan ini membolehkan pengguna mengehadkan bilangan token yang digunakan oleh model untuk penaakulan atau mematikan fungsi pemikiran sepenuhnya, mengimbangi prestasi dengan kecekapan ekonomi. Ciri ini menangani cabaran kritikal bagi perniagaan yang menggunakan AI canggih pada skala besar, kerana keupayaan penaakulan biasanya melibatkan kos operasi yang jauh lebih tinggi.
Google Meluaskan Kawalan Kos AI ke Gemini 2.5 Pro

Google telah mengumumkan peluasan ciri inovatif 'bajet pemikiran' ke Gemini 2.5 Pro, model penaakulan AI paling canggih syarikat itu, selepas pelaksanaannya yang berjaya dalam Gemini 2.5 Flash awal tahun ini.

Ciri bajet pemikiran ini mewakili satu kemajuan penting dalam pengurusan kos AI, membolehkan pembangun mengawal dengan tepat berapa banyak kuasa pengkomputeran yang diperuntukkan untuk menyelesaikan masalah yang kompleks. Dengan keupayaan ini, pengguna boleh menetapkan bilangan maksimum token yang digunakan oleh model untuk penaakulan dalaman sebelum menghasilkan respons, atau mematikan fungsi pemikiran sepenuhnya untuk tugasan yang lebih mudah.

"Kami melancarkan 2.5 Flash dengan bajet pemikiran untuk memberi pembangun lebih kawalan terhadap kos dengan mengimbangi kepantasan dan kualiti. Dan kami meluaskan keupayaan ini ke 2.5 Pro," kata Google dalam pengumumannya. Syarikat itu mengesahkan bahawa Gemini 2.5 Pro dengan bajet akan tersedia secara umum untuk penggunaan produksi stabil dalam beberapa minggu akan datang.

Perkembangan ini menangani ketegangan asas dalam pasaran AI masa kini, di mana penaakulan yang lebih canggih biasanya meningkatkan kedua-dua kependaman dan kos. Sebagai contoh, dengan Gemini 2.5 Flash, mengaktifkan penaakulan meningkatkan kos output hampir enam kali ganda—daripada $0.60 kepada $3.50 bagi setiap sejuta token. Dengan melaksanakan bajet pemikiran, perniagaan boleh mengoptimumkan penggunaan AI mereka berdasarkan kes penggunaan tertentu, mengaktifkan penaakulan hanya apabila perlu.

Ciri ini amat bernilai untuk pelanggan perusahaan yang perlu mengurus kos penggunaan AI dengan teliti sambil masih mendapat akses kepada keupayaan canggih. Untuk pertanyaan mudah seperti terjemahan bahasa atau pencarian maklumat asas, fungsi pemikiran boleh dimatikan untuk kecekapan kos maksimum. Bagi tugasan kompleks yang memerlukan penaakulan berbilang langkah, seperti penyelesaian masalah matematik atau analisis yang mendalam, fungsi pemikiran boleh diaktifkan dan dilaraskan.

Apabila AI semakin terintegrasi dalam aliran kerja perniagaan, pendekatan Google dengan penaakulan yang boleh disesuaikan mencerminkan kematangan pasaran di mana pengoptimuman kos dan penalaan prestasi menjadi sama penting dengan keupayaan asas—menandakan fasa baharu dalam pengkomersialan teknologi AI generatif.

Source:

Latest News