Google ha lanciato una versione in anteprima di Gemini 2.5 Flash, l’ultima evoluzione del suo modello di intelligenza artificiale progettato per bilanciare prestazioni, velocità ed economicità.
Basandosi sulle fondamenta di Gemini 2.0 Flash, il nuovo modello 2.5 Flash offre un importante salto di qualità nelle capacità di ragionamento, mantenendo la sua reputazione di efficienza. Google lo descrive come "un importante aggiornamento nelle capacità di ragionamento, pur continuando a dare priorità a velocità e costi".
La caratteristica distintiva di Gemini 2.5 Flash è il suo sistema di ragionamento ibrido. Si tratta del "primo modello di ragionamento completamente ibrido di Google, che consente agli sviluppatori di attivare o disattivare il pensiero e impostare budget di pensiero per ottimizzare l’equilibrio tra qualità, costo e latenza". Questo approccio innovativo offre agli sviluppatori un controllo senza precedenti su come il modello affronta compiti complessi.
In pratica, ciò significa che gli sviluppatori possono specificare un "budget di pensiero" che regola quanto ragionamento il modello esegue. È possibile regolare "il numero di token che il modello può generare durante il ragionamento" da 0 a 24.576 token tramite uno slider in Google AI Studio e Vertex AI, oppure tramite un parametro API. Quando il budget di pensiero è impostato a zero, il modello eguaglia i costi e la latenza di Gemini 2.0 Flash.
La struttura dei prezzi riflette questa flessibilità: i token in input costano 15 centesimi per milione e quelli in output 60 centesimi per milione senza ragionamento. Con le capacità di ragionamento attivate, il costo sale a 3,50 dollari per milione di token.
I test di benchmark mostrano risultati impressionanti. Gemini 2.5 Flash "ottiene ottimi risultati su Hard Prompts in LMArena, secondo solo al 2.5 Pro" e "presenta metriche comparabili ad altri modelli di punta a una frazione del costo e delle dimensioni", continuando "a distinguersi come il modello con il miglior rapporto qualità-prezzo".
Google descrive 2.5 Flash come il suo "modello da lavoro più efficiente, progettato per velocità e basso costo", sottolineando che "ha migliorato i risultati nei principali benchmark di ragionamento, multimodalità, codice e contesto lungo, diventando ancora più efficiente e utilizzando il 20-30% di token in meno" nelle valutazioni.
Il nuovo modello è attualmente disponibile in modalità anteprima tramite diversi canali. È in fase di distribuzione "su Google AI Studio (sviluppatori), Vertex AI (aziende) e l’app Gemini (per tutti)". Secondo gli annunci di Google all’I/O 2025, la versione aggiornata sarà "generalmente disponibile su Google AI Studio per gli sviluppatori e su Vertex AI per le aziende all’inizio di giugno", seguita a breve da Gemini 2.5 Pro.
Man mano che Google continua ad ampliare le sue capacità di intelligenza artificiale, Gemini 2.5 Flash rappresenta un passo avanti significativo nel rendere il ragionamento avanzato più accessibile ed economico sia per gli sviluppatori che per gli utenti.