Google repousse les limites de l’assistance par intelligence artificielle avec l’introduction du Mode Agent pour Gemini, marquant un passage fondamental des systèmes réactifs de type question-réponse vers des agents proactifs capables d’accomplir des tâches de façon autonome.
Annoncé lors de Google I/O 2025, le Mode Agent permet aux utilisateurs d’énoncer simplement leurs objectifs, Gemini orchestrant intelligemment les étapes nécessaires pour les atteindre. Cette fonctionnalité combine des capacités avancées telles que la navigation web en direct, la recherche approfondie et des intégrations intelligentes avec les applications Google afin de gérer des tâches complexes et multi-étapes avec un minimum d’intervention humaine.
« Imaginez simplement énoncer votre objectif, et Gemini orchestre intelligemment les étapes pour l’atteindre », a expliqué Google lors de l’annonce. La technologie s’appuie sur Project Mariner, l’agent IA expérimental de Google capable de comprendre et de raisonner à travers les informations affichées sur les écrans de navigateur, qu’il s’agisse de texte, d’images, de formulaires ou d’autres éléments web.
Google apporte également les capacités d’utilisation de l’ordinateur de Project Mariner à l’API Gemini et à Vertex AI, permettant aux développeurs de créer des applications alimentées par ces fonctionnalités agentiques. Des entreprises telles qu’Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company et Cartwheel explorent déjà son potentiel, avec un accès élargi aux développeurs prévu pour cet été.
La technologie affiche des capacités impressionnantes, dont une fonction « enseigner et répéter » où les utilisateurs peuvent démontrer une tâche une fois, permettant à l’IA d’apprendre et de reproduire des tâches similaires à l’avenir. En pratique, le Mode Agent peut par exemple aider à la recherche d’un appartement en explorant des annonces sur des sites comme Zillow, en ajustant les filtres et même en programmant des visites selon les critères de l’utilisateur.
Cette avancée représente une évolution majeure dans la manière dont les utilisateurs interagissent avec les assistants IA. Plutôt que de devoir donner des instructions spécifiques pour chaque étape, les utilisateurs peuvent désormais déléguer des objectifs entiers à Gemini, qui détermine et exécute de façon autonome les actions nécessaires. Une version expérimentale du Mode Agent sera bientôt disponible pour les abonnés Google AI Ultra, l’entreprise mettant l’accent sur le contrôle utilisateur, la transparence et la sécurité tout au long de l’expérience.