Google repousse les limites de l’assistance par intelligence artificielle avec l’introduction du Mode Agent pour Gemini, marquant une transition fondamentale des systèmes réactifs de type question-réponse vers des agents proactifs capables d’accomplir des tâches de façon autonome.
Annoncé lors de Google I/O 2025, le Mode Agent permet aux utilisateurs d’énoncer simplement leurs objectifs, puis Gemini orchestre intelligemment les étapes nécessaires pour les atteindre. Cette fonctionnalité combine des capacités avancées, notamment la navigation web en temps réel, la recherche approfondie et des intégrations intelligentes avec les applications Google pour gérer des tâches complexes et à étapes multiples, tout en nécessitant peu d’intervention de l’utilisateur.
« Imaginez simplement énoncer votre objectif, et Gemini orchestre intelligemment les étapes pour l’atteindre », a expliqué Google lors de l’annonce. Cette technologie s’appuie sur le Projet Mariner, l’agent IA expérimental de Google capable de comprendre et de raisonner à travers l’information affichée sur les écrans de navigateur, y compris le texte, les images, les formulaires et d’autres éléments web.
Google apporte également les capacités d’utilisation d’ordinateur du Projet Mariner à l’API Gemini et à Vertex AI, permettant ainsi aux développeurs de concevoir des applications alimentées par ces fonctionnalités agentiques. Des entreprises telles qu’Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company et Cartwheel explorent déjà son potentiel, et un accès élargi aux développeurs est prévu pour cet été.
La technologie démontre des capacités impressionnantes, dont une fonction « enseigner et répéter » où les utilisateurs peuvent démontrer une tâche une seule fois, permettant à l’IA d’apprendre et de reproduire des tâches similaires à l’avenir. Dans des applications concrètes, le Mode Agent peut, par exemple, aider à la recherche d’un appartement en consultant les annonces sur des sites comme Zillow, en ajustant les filtres et même en planifiant des visites selon les critères de l’utilisateur.
Cette avancée représente une évolution majeure dans la façon dont les utilisateurs interagissent avec les assistants IA. Plutôt que de devoir donner des commandes précises pour chaque étape, les utilisateurs peuvent désormais déléguer des objectifs entiers à Gemini, qui déterminera et exécutera de façon autonome les actions nécessaires. Une version expérimentale du Mode Agent sera bientôt offerte aux abonnés de Google AI Ultra, l’entreprise mettant de l’avant le contrôle de l’utilisateur, la transparence et la sécurité tout au long de l’expérience.