menu
close

Google dévoile Gemini Agentique pour révolutionner les tâches complexes

Lors de Google I/O 2025, Google a annoncé le Mode Agent pour son IA Gemini, permettant l’accomplissement autonome de tâches grâce à des capacités de navigation web alimentées par le Projet Mariner. Cette nouvelle fonctionnalité permettra à Gemini d’effectuer des tâches complexes comme la recherche d’appartements sur des sites tels que Zillow, de la sélection des annonces à la planification des visites. Google a également annoncé la compatibilité entre son API/SDK Gemini et le Model Context Protocol d’Anthropic, signalant une collaboration croissante de l’industrie sur les standards des agents.
Google dévoile Gemini Agentique pour révolutionner les tâches complexes

Google fait un bond majeur dans le domaine des agents IA avec l’introduction du Mode Agent pour sa plateforme Gemini, annoncée lors de la conférence des développeurs Google I/O 2025 le 20 mai.

Propulsé par la technologie Projet Mariner de Google, le Mode Agent transforme Gemini en assistant autonome capable d’effectuer des tâches complexes en plusieurs étapes avec un minimum de supervision de l’utilisateur. Cette fonctionnalité permet à Gemini de naviguer sur des sites web, d’interpréter des éléments visuels et textuels, et d’exécuter des actions au nom des utilisateurs.

« Imaginez simplement énoncer votre objectif, et Gemini orchestre intelligemment les étapes pour l’atteindre », a expliqué Google dans son annonce. « Le Mode Agent combine de façon transparente des fonctions avancées comme la navigation web en direct, la recherche approfondie et des intégrations intelligentes avec vos applications Google. »

Lors d’une démonstration pendant la présentation principale, le PDG de Google, Sundar Pichai, a montré comment le Mode Agent pouvait simplifier la recherche d’un appartement. L’IA peut rechercher des annonces sur Zillow selon les critères de l’utilisateur, ajuster les filtres et même planifier des visites de propriétés — le tout sans que l’utilisateur ait à visiter plusieurs sites ou à gérer les détails manuellement.

La technologie fonctionne sur des machines virtuelles infonuagiques et peut gérer jusqu’à dix tâches simultanément, permettant aux utilisateurs de se concentrer sur d’autres activités pendant que Gemini s’occupe des processus chronophages en arrière-plan. Cette capacité représente une avancée importante dans la façon dont les utilisateurs pourraient interagir avec Internet à l’avenir.

Dans un mouvement vers la standardisation de l’industrie, Google a également annoncé la compatibilité entre son API/SDK Gemini et le Model Context Protocol (MCP) introduit par Anthropic. Le MCP est une norme ouverte qui permet aux assistants IA de se connecter à des outils externes, des sources de données et des systèmes via un protocole unifié.

« Le MCP est un bon protocole et il est rapidement en train de devenir une norme ouverte pour l’ère des agents IA », a déclaré Demis Hassabis, PDG de Google DeepMind, soulignant l’engagement de l’entreprise à le développer davantage avec Anthropic et d’autres partenaires de l’industrie.

Le Mode Agent sera d’abord offert aux abonnés Google AI Ultra aux États-Unis, avec des plans d’expansion vers d’autres pays prochainement. L’entreprise rendra aussi les capacités du Projet Mariner accessibles aux développeurs via l’API Gemini cet été, avec des testeurs de confiance comme Automation Anywhere et UiPath qui exploitent déjà la technologie.

Source:

Latest News