menu
close

Google presenta Gemini 2.5 Flash con capacità di ragionamento avanzate

Google ha rilasciato Gemini 2.5 Flash in modalità anteprima, apportando significativi miglioramenti al suo modello di intelligenza artificiale veloce ed economico. Questa nuova versione introduce capacità di ragionamento ibride che permettono agli sviluppatori di controllare il processo di pensiero del modello mantenendo velocità ed efficienza. L’anteprima è ora disponibile su Google AI Studio, Vertex AI e l’app Gemini, con la disponibilità generale prevista per l’inizio di giugno 2025.
Google presenta Gemini 2.5 Flash con capacità di ragionamento avanzate

Google ha lanciato una versione in anteprima di Gemini 2.5 Flash, l’ultima evoluzione del suo modello di intelligenza artificiale progettato per bilanciare prestazioni, velocità ed economicità.

Basandosi sulle fondamenta di Gemini 2.0 Flash, il nuovo modello 2.5 Flash offre un importante salto di qualità nelle capacità di ragionamento, mantenendo la sua reputazione di efficienza. Google lo descrive come "un importante aggiornamento nelle capacità di ragionamento, pur continuando a dare priorità a velocità e costi".

La caratteristica distintiva di Gemini 2.5 Flash è il suo sistema di ragionamento ibrido. Si tratta del "primo modello di ragionamento completamente ibrido di Google, che consente agli sviluppatori di attivare o disattivare il pensiero e impostare budget di pensiero per ottimizzare l’equilibrio tra qualità, costo e latenza". Questo approccio innovativo offre agli sviluppatori un controllo senza precedenti su come il modello affronta compiti complessi.

In pratica, ciò significa che gli sviluppatori possono specificare un "budget di pensiero" che regola quanto ragionamento il modello esegue. È possibile regolare "il numero di token che il modello può generare durante il ragionamento" da 0 a 24.576 token tramite uno slider in Google AI Studio e Vertex AI, oppure tramite un parametro API. Quando il budget di pensiero è impostato a zero, il modello eguaglia i costi e la latenza di Gemini 2.0 Flash.

La struttura dei prezzi riflette questa flessibilità: i token in input costano 15 centesimi per milione e quelli in output 60 centesimi per milione senza ragionamento. Con le capacità di ragionamento attivate, il costo sale a 3,50 dollari per milione di token.

I test di benchmark mostrano risultati impressionanti. Gemini 2.5 Flash "ottiene ottimi risultati su Hard Prompts in LMArena, secondo solo al 2.5 Pro" e "presenta metriche comparabili ad altri modelli di punta a una frazione del costo e delle dimensioni", continuando "a distinguersi come il modello con il miglior rapporto qualità-prezzo".

Google descrive 2.5 Flash come il suo "modello da lavoro più efficiente, progettato per velocità e basso costo", sottolineando che "ha migliorato i risultati nei principali benchmark di ragionamento, multimodalità, codice e contesto lungo, diventando ancora più efficiente e utilizzando il 20-30% di token in meno" nelle valutazioni.

Il nuovo modello è attualmente disponibile in modalità anteprima tramite diversi canali. È in fase di distribuzione "su Google AI Studio (sviluppatori), Vertex AI (aziende) e l’app Gemini (per tutti)". Secondo gli annunci di Google all’I/O 2025, la versione aggiornata sarà "generalmente disponibile su Google AI Studio per gli sviluppatori e su Vertex AI per le aziende all’inizio di giugno", seguita a breve da Gemini 2.5 Pro.

Man mano che Google continua ad ampliare le sue capacità di intelligenza artificiale, Gemini 2.5 Flash rappresenta un passo avanti significativo nel rendere il ragionamento avanzato più accessibile ed economico sia per gli sviluppatori che per gli utenti.

Source:

Latest News