menu
close

Google Estende i Controlli sui Costi dell’IA a Gemini 2.5 Pro

Google ha ampliato la funzione di 'thinking budgets' da Gemini 2.5 Flash a Gemini 2.5 Pro, offrendo agli sviluppatori un controllo preciso sui costi di ragionamento dell’IA. Questa capacità consente agli utenti di limitare il numero di token utilizzati dal modello per il ragionamento o di disattivare completamente la funzione di pensiero, bilanciando prestazioni ed efficienza economica. La funzione risponde a una sfida cruciale per le aziende che implementano IA avanzata su larga scala, poiché le capacità di ragionamento comportano solitamente costi operativi significativamente più elevati.
Google Estende i Controlli sui Costi dell’IA a Gemini 2.5 Pro

Google ha annunciato l’estensione della sua innovativa funzione di 'thinking budgets' a Gemini 2.5 Pro, il modello di ragionamento IA più avanzato dell’azienda, dopo il successo della sua implementazione su Gemini 2.5 Flash all’inizio di quest’anno.

La funzione thinking budgets rappresenta un importante passo avanti nella gestione dei costi dell’IA, consentendo agli sviluppatori di controllare con precisione quanta potenza computazionale viene dedicata al ragionamento su problemi complessi. Grazie a questa capacità, gli utenti possono specificare il numero massimo di token che un modello utilizza per il ragionamento interno prima di generare una risposta, oppure disattivare del tutto le capacità di pensiero per compiti più semplici.

"Abbiamo lanciato 2.5 Flash con i thinking budgets per offrire agli sviluppatori un maggiore controllo sui costi, bilanciando latenza e qualità. Ora estendiamo questa funzionalità anche a 2.5 Pro", ha dichiarato Google nel suo annuncio. L’azienda ha confermato che Gemini 2.5 Pro con i budgets sarà generalmente disponibile per l’uso stabile in produzione nelle prossime settimane.

Questa novità affronta una delle principali sfide del mercato attuale dell’IA, dove un ragionamento più sofisticato comporta tipicamente un aumento sia della latenza che dei costi. Ad esempio, con Gemini 2.5 Flash, abilitare il ragionamento fa aumentare quasi di sei volte i costi di output: da 0,60 a 3,50 dollari per milione di token. Implementando i thinking budgets, le aziende possono ottimizzare le proprie implementazioni IA in base ai casi d’uso specifici, attivando il ragionamento solo quando necessario.

La funzione risulta particolarmente preziosa per i clienti enterprise che devono gestire con attenzione i costi di implementazione dell’IA senza rinunciare a capacità avanzate. Per richieste semplici come traduzioni linguistiche o recupero di informazioni di base, il pensiero può essere disattivato per massimizzare l’efficienza dei costi. Per compiti complessi che richiedono ragionamenti articolati, come la risoluzione di problemi matematici o analisi approfondite, la funzione di pensiero può essere attivata e regolata finemente.

Man mano che l’IA si integra sempre più nei flussi di lavoro aziendali, l’approccio di Google con il ragionamento personalizzabile riflette un mercato in fase di maturazione, dove l’ottimizzazione dei costi e la regolazione delle prestazioni stanno diventando importanti quanto le capacità pure—segnando una nuova fase nella commercializzazione delle tecnologie di IA generativa.

Source:

Latest News