Google ha implementato importanti aggiornamenti di sicurezza nella famiglia di modelli di IA Gemini 2.5, affermandoli come i modelli più sicuri mai sviluppati dall’azienda in risposta alle crescenti minacce alla sicurezza dell’intelligenza artificiale.
Al centro di questi miglioramenti c’è un nuovo approccio alla sicurezza che aumenta notevolmente la protezione di Gemini contro gli attacchi di injection indiretta dei prompt durante l’utilizzo degli strumenti. Questi attacchi si verificano quando istruzioni malevole vengono incorporate nei dati che un modello di IA recupera, con il rischio che il modello esegua comandi dannosi o divulghi informazioni sensibili.
I miglioramenti alla sicurezza arrivano mentre Google si prepara a integrare le capacità di utilizzo del computer di Project Mariner nelle API Gemini e in Vertex AI. Project Mariner consente agli agenti di IA di controllare i browser web ed eseguire automaticamente compiti specifici, tra cui la navigazione su siti e l’interazione con elementi web. Diverse aziende, tra cui Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company e Cartwheel, stanno già testando queste funzionalità, con un accesso più ampio agli sviluppatori previsto per l’estate.
La strategia di sicurezza di Google per Gemini 2.5 prevede molteplici livelli difensivi, tra cui il red teaming automatizzato (ART) che sonda costantemente la presenza di vulnerabilità. Secondo le ricerche di Google DeepMind, questo approccio ha ridotto in modo significativo il tasso di successo degli attacchi adattivi rispetto alle versioni precedenti del modello. L’azienda ha inoltre perfezionato Gemini su set di dati contenenti scenari di attacco realistici, insegnando al modello a ignorare istruzioni malevole incorporate e a seguire solo le richieste legittime degli utenti.
Oltre agli aggiornamenti di sicurezza, i modelli Gemini 2.5 stanno ricevendo nuove funzionalità, tra cui i riassunti del ragionamento nelle API Gemini e in Vertex AI, che organizzano il processo decisionale del modello in un formato strutturato per una maggiore trasparenza e facilità di debug. I modelli supportano anche l’output audio nativo, offrendo esperienze conversazionali più naturali.
Il modello Gemini 2.5 Flash è ora disponibile per tutti nell’app Gemini, mentre la disponibilità generale per sviluppatori in Google AI Studio e per le aziende in Vertex AI è prevista per l’inizio di giugno. Gemini 2.5 Pro seguirà a breve, portando le sue funzionalità di sicurezza avanzate a un pubblico ancora più ampio.