Google renforce ses capacités en intelligence artificielle en intégrant les fonctionnalités d’utilisation informatique de Project Mariner à ses plateformes Gemini API et Vertex AI, représentant une avancée significative dans le développement des systèmes d’IA agentique.
Project Mariner, dévoilé pour la première fois fin 2024, est un prototype de recherche de Google DeepMind qui explore l’interaction humain-agent à travers les navigateurs web. Le système peut observer ce qui s’affiche dans les navigateurs, interpréter des objectifs complexes, planifier des étapes concrètes et naviguer sur des sites web pour accomplir des tâches de manière autonome. Il peut gérer plusieurs opérations simultanément, la dernière version étant capable d’exécuter jusqu’à dix tâches différentes en même temps.
Plusieurs entreprises technologiques explorent déjà le potentiel de Project Mariner. Automation Anywhere, leader de l’automatisation des processus agentiques, et UiPath, reconnu pour sa plateforme d’automatisation, figurent parmi les premiers adoptants. D’autres partenaires incluent Browserbase, qui développe des frameworks d’automatisation de navigateur par IA, Autotab, The Interaction Company, et Cartwheel, une plateforme de conversion texte-en-animation fondée en 2023.
L’intégration avec Gemini API et Vertex AI permettra aux développeurs de créer des applications reposant sur ces capacités d’agents. Google a également renforcé de manière significative les protections de sécurité contre les menaces telles que les injections de requêtes indirectes, faisant de Gemini 2.5 sa famille de modèles la plus sécurisée à ce jour.
Les abonnés à Google AI Ultra aux États-Unis ont déjà accès à Project Mariner, avec un accès élargi aux développeurs prévu pour cet été. L’entreprise prévoit également d’intégrer certaines des fonctionnalités de Mariner à d’autres produits Google, notamment le mode IA dans Search Labs, où il permettra d’effectuer des tâches telles que l’achat de billets d’événement ou la réservation de restaurants.
Ce développement marque un changement fondamental dans la manière dont les utilisateurs interagissent avec Internet, passant potentiellement d’une interaction directe avec les sites web à la délégation de tâches à des agents IA. À mesure que ces capacités mûrissent, elles pourraient révolutionner l’automatisation dans de nombreux secteurs et permettre l’émergence de nouvelles applications pour les assistants intelligents.