menu
close

Mode Agent de Gemini de Google : les assistants IA évoluent du réactif au proactif

Google a dévoilé le Mode Agent, une fonctionnalité révolutionnaire pour Gemini qui permet aux utilisateurs de simplement décrire leurs objectifs finaux et de laisser l’IA accomplir de manière autonome des tâches complexes à leur place. Cette capacité expérimentale s’appuie sur la technologie d’utilisation de l’ordinateur du Project Mariner, également intégrée à l’API Gemini et à Vertex AI pour les développeurs. Plusieurs entreprises, dont Automation Anywhere, UiPath et Browserbase, explorent déjà son potentiel pour transformer les flux de travail automatisés.
Mode Agent de Gemini de Google : les assistants IA évoluent du réactif au proactif

Google repousse les limites de l’assistance par intelligence artificielle avec l’introduction du Mode Agent pour Gemini, marquant un passage fondamental des systèmes réactifs de type question-réponse vers des agents proactifs capables d’accomplir des tâches de façon autonome.

Annoncé lors de Google I/O 2025, le Mode Agent permet aux utilisateurs d’énoncer simplement leurs objectifs, Gemini orchestrant intelligemment les étapes nécessaires pour les atteindre. Cette fonctionnalité combine des capacités avancées telles que la navigation web en direct, la recherche approfondie et des intégrations intelligentes avec les applications Google afin de gérer des tâches complexes et multi-étapes avec un minimum d’intervention humaine.

« Imaginez simplement énoncer votre objectif, et Gemini orchestre intelligemment les étapes pour l’atteindre », a expliqué Google lors de l’annonce. La technologie s’appuie sur Project Mariner, l’agent IA expérimental de Google capable de comprendre et de raisonner à travers les informations affichées sur les écrans de navigateur, qu’il s’agisse de texte, d’images, de formulaires ou d’autres éléments web.

Google apporte également les capacités d’utilisation de l’ordinateur de Project Mariner à l’API Gemini et à Vertex AI, permettant aux développeurs de créer des applications alimentées par ces fonctionnalités agentiques. Des entreprises telles qu’Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company et Cartwheel explorent déjà son potentiel, avec un accès élargi aux développeurs prévu pour cet été.

La technologie affiche des capacités impressionnantes, dont une fonction « enseigner et répéter » où les utilisateurs peuvent démontrer une tâche une fois, permettant à l’IA d’apprendre et de reproduire des tâches similaires à l’avenir. En pratique, le Mode Agent peut par exemple aider à la recherche d’un appartement en explorant des annonces sur des sites comme Zillow, en ajustant les filtres et même en programmant des visites selon les critères de l’utilisateur.

Cette avancée représente une évolution majeure dans la manière dont les utilisateurs interagissent avec les assistants IA. Plutôt que de devoir donner des instructions spécifiques pour chaque étape, les utilisateurs peuvent désormais déléguer des objectifs entiers à Gemini, qui détermine et exécute de façon autonome les actions nécessaires. Une version expérimentale du Mode Agent sera bientôt disponible pour les abonnés Google AI Ultra, l’entreprise mettant l’accent sur le contrôle utilisateur, la transparence et la sécurité tout au long de l’expérience.

Source:

Latest News