Google ha ampliato significativamente le sue capacità di intelligenza artificiale con il rilascio di Imagen 4, il suo modello di generazione immagini da testo più avanzato, ora disponibile in anteprima a pagamento tramite l’API Gemini e Google AI Studio.
Imagen 4 rappresenta un notevole miglioramento rispetto alle versioni precedenti, in particolare nella qualità della resa del testo all’interno delle immagini generate. Il rilascio comprende due varianti: il modello standard Imagen 4, al prezzo di 0,04 dollari per immagine generata, e Imagen 4 Ultra, a 0,06 dollari per immagine, che offre una maggiore precisione nell’esecuzione delle istruzioni dell’utente. Entrambi i modelli integrano la tecnologia di watermarking SynthID, invisibile all’occhio umano ma utile per identificare i contenuti generati dall’IA.
Questo rilascio si inserisce nell’ampliamento della famiglia di modelli Gemini 2.5 di Google. L’azienda ha reso disponibili per tutti Gemini 2.5 Flash e Pro, dopo periodi di anteprima di successo, e ha introdotto Gemini 2.5 Flash-Lite in anteprima. Flash-Lite si posiziona come il modello 2.5 più economico e veloce di Google, ottimizzato per attività ad alto volume e sensibili alla latenza come classificazione, traduzione e instradamento intelligente.
Nonostante l’attenzione all’efficienza, Gemini 2.5 Flash-Lite mantiene le principali funzionalità della famiglia 2.5, tra cui una finestra di contesto da 1 milione di token e il supporto per strumenti nativi come l’integrazione con Google Search e l’esecuzione di codice. A differenza degli altri modelli della famiglia, che hanno le capacità di “thinking” attive di default, Flash-Lite consente agli sviluppatori di controllare i budget di thinking tramite parametri API, con il thinking disattivato di default per ottimizzare velocità e costi.
Per rafforzare ulteriormente la propria offerta per gli sviluppatori, Google ha rilasciato Gemini CLI, un agente IA open source che porta Gemini direttamente nel terminale. Questo strumento permette agli sviluppatori di accedere a Gemini 2.5 Pro tramite interfaccia a riga di comando per attività di coding, problem solving e gestione dei task. La natura open source di Gemini CLI (sotto licenza Apache 2.0) consente agli sviluppatori di ispezionare il codice, verificarne la sicurezza e contribuire al suo sviluppo.
Le ultime novità IA di Google dimostrano l’impegno dell’azienda nel fornire agli sviluppatori strumenti sempre più potenti e flessibili, adatti a diverse fasce di prezzo e casi d’uso: dalla generazione di immagini di alta qualità all’elaborazione efficiente di testo, fino all’assistenza IA direttamente dal terminale.