Google poursuit l’expansion de ses capacités en intelligence artificielle en intégrant les fonctionnalités d’utilisation d’ordinateur de Project Mariner à ses plateformes Gemini API et Vertex AI, représentant une étape importante dans le développement de systèmes d’IA agentique.
Project Mariner, dévoilé pour la première fois à la fin de 2024, est un prototype de recherche de Google DeepMind qui explore l’interaction humain-agent via les navigateurs web. Le système peut observer ce qui est affiché dans les navigateurs, interpréter des objectifs complexes, planifier des étapes concrètes et naviguer sur des sites web afin d’accomplir des tâches de façon autonome. Il peut gérer plusieurs opérations en même temps, la version la plus récente étant capable de réaliser jusqu’à dix tâches différentes simultanément.
Plusieurs entreprises technologiques explorent déjà le potentiel de Project Mariner. Automation Anywhere, un chef de file en automatisation des processus agentiques, et UiPath, reconnu pour sa plateforme d’automatisation, figurent parmi les premiers utilisateurs. D’autres partenaires incluent Browserbase, qui développe des cadres d’automatisation de navigateur par IA, Autotab, The Interaction Company, ainsi que Cartwheel, une plateforme de conversion texte-en-animation fondée en 2023.
L’intégration à l’API Gemini et à Vertex AI permettra aux développeurs de créer des applications alimentées par ces capacités d’agents. Google a également renforcé de façon significative les protections de sécurité contre des menaces comme les injections indirectes de commandes, faisant de Gemini 2.5 sa famille de modèles la plus sécuritaire à ce jour.
Les abonnés à Google AI Ultra aux États-Unis ont déjà accès à Project Mariner, et un accès élargi pour les développeurs est prévu cet été. L’entreprise prévoit aussi d’intégrer certaines fonctionnalités de Mariner à d’autres produits Google, notamment le mode IA dans Search Labs, où il permettra d’effectuer des tâches comme l’achat de billets pour des événements ou la réservation de restaurants.
Ce développement représente un changement fondamental dans la façon dont les utilisateurs interagissent avec Internet, passant potentiellement d’une interaction directe avec les sites web à la délégation de tâches à des agents IA. À mesure que ces capacités évolueront, elles pourraient révolutionner l’automatisation dans de nombreux secteurs et permettre l’émergence de nouvelles applications pour les assistants IA.