menu
close

Google utökar AI-kostnadskontroller till Gemini 2.5 Pro

Google har utökat sin funktion för 'tänkarbudgetar' från Gemini 2.5 Flash till Gemini 2.5 Pro, vilket ger utvecklare exakt kontroll över kostnaderna för AI-resonemang. Med denna funktion kan användare begränsa antalet tokens en modell använder för resonemang eller helt inaktivera tänkandet, vilket balanserar prestanda med ekonomisk effektivitet. Funktionen adresserar en avgörande utmaning för företag som implementerar avancerad AI i stor skala, då resonemangsförmåga vanligtvis innebär betydligt högre driftskostnader.
Google utökar AI-kostnadskontroller till Gemini 2.5 Pro

Google har meddelat att företagets innovativa funktion för 'tänkarbudgetar' nu även finns tillgänglig i Gemini 2.5 Pro, deras mest avancerade AI-modell för resonemang, efter en lyckad lansering i Gemini 2.5 Flash tidigare i år.

Tänkarbudgetar innebär ett stort framsteg inom AI-kostnadshantering och gör det möjligt för utvecklare att exakt styra hur mycket beräkningskraft som tilldelas resonemang kring komplexa problem. Med denna funktion kan användare ange det maximala antalet tokens en modell får använda för internt resonemang innan ett svar genereras, eller till och med helt stänga av tänkandet för enklare uppgifter.

"Vi lanserade 2.5 Flash med tänkarbudgetar för att ge utvecklare bättre kontroll över kostnader genom att balansera svarstid och kvalitet. Nu utökar vi denna möjlighet till 2.5 Pro," uppgav Google i sitt tillkännagivande. Företaget bekräftar att Gemini 2.5 Pro med budgetfunktionalitet kommer att bli allmänt tillgänglig för stabil produktion inom de närmaste veckorna.

Denna utveckling adresserar en grundläggande utmaning på dagens AI-marknad, där mer sofistikerat resonemang ofta innebär både högre svarstid och ökade kostnader. Till exempel innebär aktivering av resonemang i Gemini 2.5 Flash att utdata­kostnaden nästan sexdubblas – från 0,60 till 3,50 dollar per miljon tokens. Genom att införa tänkarbudgetar kan företag optimera sina AI-implementeringar utifrån specifika användningsfall och endast aktivera resonemang när det verkligen behövs.

Funktionen är särskilt värdefull för företagskunder som behöver noggrant hantera AI-kostnader men ändå vill ha tillgång till avancerade funktioner. För enkla frågor som språköversättning eller grundläggande informationssökning kan tänkandet stängas av för maximal kostnadseffektivitet. Vid mer komplexa uppgifter som kräver flerstegsresonemang, exempelvis matematisk problemlösning eller nyanserad analys, kan tänkandet aktiveras och finjusteras.

I takt med att AI blir alltmer integrerat i företags arbetsflöden speglar Googles strategi med anpassningsbart resonemang en mognande marknad där kostnadsoptimering och prestandajustering blir lika viktiga som själva kapabiliteterna – och markerar en ny fas i kommersialiseringen av generativ AI-teknik.

Source:

Latest News