Google har infört omfattande säkerhetsuppgraderingar i sin Gemini 2.5-familj av AI-modeller och gör dem därmed till företagets säkraste modeller hittills som svar på de växande säkerhetshoten mot AI.
Kärnan i dessa förbättringar är en ny säkerhetsstrategi som kraftigt ökar Geminis skydd mot indirekta prompt-injektionsattacker vid verktygsanvändning. Dessa attacker sker när skadliga instruktioner göms i data som en AI-modell hämtar, vilket potentiellt kan få modellen att utföra skadliga kommandon eller läcka känslig information.
Säkerhetsförbättringarna kommer samtidigt som Google förbereder integrationen av Project Mariners datoranvändningsfunktioner i Gemini API och Vertex AI. Project Mariner gör det möjligt för AI-agenter att styra webbläsare och automatiskt utföra specifika uppgifter, såsom att navigera på webbplatser och interagera med webbelement. Flera företag, däribland Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company och Cartwheel, testar redan dessa funktioner, och bredare tillgång för utvecklare väntas till sommaren.
Googles säkerhetsstrategi för Gemini 2.5 bygger på flera försvarslager, inklusive automatiserad red teaming (ART) som kontinuerligt söker efter sårbarheter. Enligt Google DeepMinds forskning har detta tillvägagångssätt kraftigt minskat framgångsgraden för adaptiva attacker jämfört med tidigare modellversioner. Företaget har finjusterat Gemini på datamängder med realistiska attackscenarier, vilket lär modellen att ignorera skadliga inbäddade instruktioner samtidigt som den följer legitima användarförfrågningar.
Utöver säkerhetsförbättringarna får Gemini 2.5-modellerna även nya funktioner, såsom "thought summaries" i Gemini API och Vertex AI, där modellens resonemang organiseras i ett strukturerat format för ökad transparens och enklare felsökning. Modellerna har också stöd för inbyggd ljudutmatning för mer naturliga konversationsupplevelser.
Gemini 2.5 Flash-modellen är nu tillgänglig för alla i Gemini-appen, med allmän tillgänglighet i Google AI Studio för utvecklare och Vertex AI för företag i början av juni. Gemini 2.5 Pro lanseras kort därefter och för med sig sina förbättrade säkerhetsfunktioner till en bredare publik.