Google a mis en place d’importantes améliorations de sécurité pour sa famille de modèles d’IA Gemini 2.5, les érigeant comme les modèles les plus sûrs de l’entreprise face à l’évolution des menaces sur l’IA.
Au cœur de ces améliorations se trouve une nouvelle approche de sécurité qui accroît de manière significative la protection de Gemini contre les attaques indirectes par injection de prompt lors de l’utilisation d’outils. Ces attaques surviennent lorsque des instructions malveillantes sont dissimulées dans les données récupérées par un modèle d’IA, pouvant amener ce dernier à exécuter des commandes nuisibles ou à divulguer des informations sensibles.
Ces avancées en matière de sécurité coïncident avec l’intégration prochaine par Google des capacités d’utilisation informatique du Project Mariner dans l’API Gemini et Vertex AI. Project Mariner permet aux agents d’IA de contrôler des navigateurs web et d’effectuer automatiquement des tâches spécifiques, comme la navigation sur des sites web ou l’interaction avec des éléments en ligne. Plusieurs entreprises, dont Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company et Cartwheel, testent déjà ces fonctionnalités, avec une ouverture plus large aux développeurs prévue pour cet été.
La stratégie de sécurité de Google pour Gemini 2.5 repose sur plusieurs couches défensives, notamment le red teaming automatisé (ART) qui recherche en continu des vulnérabilités. Selon les recherches de Google DeepMind, cette approche a permis de réduire significativement le taux de réussite des attaques adaptatives par rapport aux versions précédentes du modèle. L’entreprise a affiné Gemini à l’aide de jeux de données contenant des scénarios d’attaque réalistes, apprenant ainsi au modèle à ignorer les instructions malveillantes intégrées tout en répondant correctement aux requêtes légitimes des utilisateurs.
Au-delà des améliorations de sécurité, les modèles Gemini 2.5 bénéficient de nouvelles fonctionnalités, dont les résumés de réflexion dans l’API Gemini et Vertex AI, qui organisent le raisonnement du modèle sous une forme structurée pour une meilleure transparence et un débogage facilité. Les modèles prennent également en charge la sortie audio native pour des échanges conversationnels plus naturels.
Le modèle Gemini 2.5 Flash est désormais accessible à tous via l’application Gemini, avec une disponibilité générale prévue début juin dans Google AI Studio pour les développeurs et Vertex AI pour les entreprises. Gemini 2.5 Pro suivra peu après, apportant ses fonctionnalités de sécurité renforcées à un public plus large.