menu
close

Mode Agent de Gemini de Google : Les assistants IA passent du réactif au proactif

Google a dévoilé le Mode Agent, une fonctionnalité révolutionnaire pour Gemini qui permet aux utilisateurs de simplement décrire leurs objectifs finaux et de laisser l’IA accomplir de façon autonome des tâches complexes en leur nom. Cette capacité expérimentale s’appuie sur la technologie d’utilisation d’ordinateur du Projet Mariner, qui sera également intégrée à l’API Gemini et à Vertex AI pour les développeurs. Plusieurs entreprises, dont Automation Anywhere, UiPath et Browserbase, explorent déjà son potentiel pour transformer les flux de travail automatisés.
Mode Agent de Gemini de Google : Les assistants IA passent du réactif au proactif

Google repousse les limites de l’assistance par intelligence artificielle avec l’introduction du Mode Agent pour Gemini, marquant une transition fondamentale des systèmes réactifs de type question-réponse vers des agents proactifs capables d’accomplir des tâches de façon autonome.

Annoncé lors de Google I/O 2025, le Mode Agent permet aux utilisateurs d’énoncer simplement leurs objectifs, puis Gemini orchestre intelligemment les étapes nécessaires pour les atteindre. Cette fonctionnalité combine des capacités avancées, notamment la navigation web en temps réel, la recherche approfondie et des intégrations intelligentes avec les applications Google pour gérer des tâches complexes et à étapes multiples, tout en nécessitant peu d’intervention de l’utilisateur.

« Imaginez simplement énoncer votre objectif, et Gemini orchestre intelligemment les étapes pour l’atteindre », a expliqué Google lors de l’annonce. Cette technologie s’appuie sur le Projet Mariner, l’agent IA expérimental de Google capable de comprendre et de raisonner à travers l’information affichée sur les écrans de navigateur, y compris le texte, les images, les formulaires et d’autres éléments web.

Google apporte également les capacités d’utilisation d’ordinateur du Projet Mariner à l’API Gemini et à Vertex AI, permettant ainsi aux développeurs de concevoir des applications alimentées par ces fonctionnalités agentiques. Des entreprises telles qu’Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company et Cartwheel explorent déjà son potentiel, et un accès élargi aux développeurs est prévu pour cet été.

La technologie démontre des capacités impressionnantes, dont une fonction « enseigner et répéter » où les utilisateurs peuvent démontrer une tâche une seule fois, permettant à l’IA d’apprendre et de reproduire des tâches similaires à l’avenir. Dans des applications concrètes, le Mode Agent peut, par exemple, aider à la recherche d’un appartement en consultant les annonces sur des sites comme Zillow, en ajustant les filtres et même en planifiant des visites selon les critères de l’utilisateur.

Cette avancée représente une évolution majeure dans la façon dont les utilisateurs interagissent avec les assistants IA. Plutôt que de devoir donner des commandes précises pour chaque étape, les utilisateurs peuvent désormais déléguer des objectifs entiers à Gemini, qui déterminera et exécutera de façon autonome les actions nécessaires. Une version expérimentale du Mode Agent sera bientôt offerte aux abonnés de Google AI Ultra, l’entreprise mettant de l’avant le contrôle de l’utilisateur, la transparence et la sécurité tout au long de l’expérience.

Source:

Latest News