Google a annoncé une avancée majeure dans les capacités de l’intelligence artificielle en intégrant la fonctionnalité d’utilisation de l’ordinateur du Project Mariner aux plateformes Gemini API et Vertex AI. Cette intégration représente une évolution significative dans la manière dont l’IA peut interagir avec les environnements numériques, en particulier les navigateurs web et les systèmes informatiques.
Project Mariner, dévoilé pour la première fois fin 2024 comme prototype de recherche issu de Google DeepMind, a été considérablement amélioré pour devenir un puissant système d’agents IA. La version actualisée peut désormais gérer jusqu’à dix tâches différentes simultanément, en opérant via des machines virtuelles dans le cloud plutôt que directement dans le navigateur de l’utilisateur. Cela permet aux utilisateurs de continuer à travailler pendant que l’IA exécute des tâches en arrière-plan.
La technologie permet à l’IA d’observer ce qui s’affiche à l’écran, d’interpréter des objectifs complexes, de planifier des étapes concrètes et de les exécuter en interagissant avec des sites web et des applications. Elle peut accomplir une large gamme de tâches, notamment la recherche d’informations, la réservation, le remplissage de formulaires, voire la réalisation d’achats avec confirmation de l’utilisateur.
Plusieurs entreprises explorent déjà le potentiel de cette technologie. Automation Anywhere et UiPath l’utilisent pour l’automatisation des processus métier, tandis que de nouveaux acteurs comme Browserbase, Autotab, The Interaction Company et Cartwheel développent des applications innovantes. Google prévoit de rendre ces capacités plus largement accessibles aux développeurs dès cet été.
« L’utilisation de l’ordinateur fait partie d’un ensemble plus large d’outils que nous devrons construire pour permettre à un écosystème d’agents de prospérer », a déclaré Sundar Pichai, PDG de Google, lors de la keynote Google I/O 2025. L’entreprise travaille également sur des technologies complémentaires telles que le protocole Agent2Agent, qui permettra aux agents de communiquer entre eux.
Les implications de cette technologie sont considérables. Pour les entreprises, elle promet une productivité accrue grâce à l’automatisation des tâches répétitives. Pour les développeurs, elle ouvre de nouvelles possibilités pour créer des flux de travail et des applications assistés par l’IA capables d’interagir avec les logiciels existants. Pour les utilisateurs finaux, elle pourrait à terme transformer la façon dont ils accomplissent leurs tâches numériques quotidiennes, l’IA prenant en charge une grande partie du travail fastidieux.
Actuellement, l’accès au Project Mariner est limité aux abonnés Google AI Ultra aux États-Unis, qui paient 249,99 $ par mois pour ce service. Cependant, à mesure que la technologie mûrit et s’intègre à davantage de produits Google tout au long de 2025, son impact devrait se faire sentir sur l’ensemble du paysage numérique.