Google rozszerza możliwości swojej sztucznej inteligencji, integrując funkcje obsługi komputera z Project Mariner z interfejsem Gemini API oraz platformą Vertex AI, co stanowi przełomowy krok w rozwoju agentycznych systemów AI.
Project Mariner, po raz pierwszy zaprezentowany pod koniec 2024 roku, to prototyp badawczy Google DeepMind, który bada interakcje człowieka z agentem za pośrednictwem przeglądarek internetowych. System potrafi obserwować to, co wyświetlane jest w przeglądarce, interpretować złożone cele, planować działania oraz samodzielnie poruszać się po stronach internetowych, by realizować zadania. Może wykonywać wiele operacji jednocześnie – najnowsza wersja jest w stanie realizować do dziesięciu różnych zadań naraz.
Kilka firm technologicznych już bada potencjał Project Mariner. Automation Anywhere, lider w dziedzinie agentycznej automatyzacji procesów, oraz UiPath, znany ze swojej platformy automatyzacji, należą do pierwszych użytkowników. Wśród partnerów są także Browserbase, twórca frameworków do automatyzacji przeglądarek przez AI, Autotab, The Interaction Company oraz Cartwheel – platforma tekst-na-animację założona w 2023 roku.
Integracja z Gemini API i Vertex AI umożliwi deweloperom budowanie aplikacji napędzanych możliwościami tych agentów. Google znacząco wzmocniło także zabezpieczenia przed zagrożeniami, takimi jak pośrednie ataki prompt injection, czyniąc rodzinę modeli Gemini 2.5 najbezpieczniejszą w historii.
Subskrybenci Google AI Ultra w USA już mają dostęp do Project Mariner, a szerszy dostęp dla deweloperów planowany jest na lato tego roku. Firma zamierza również wprowadzić część możliwości Mariner do innych produktów Google, w tym do trybu AI w Search Labs, gdzie umożliwi to m.in. zakup biletów na wydarzenia czy rezerwację stolików w restauracjach.
Ten rozwój oznacza fundamentalną zmianę w sposobie, w jaki użytkownicy korzystają z internetu – potencjalnie przechodząc od bezpośredniej interakcji ze stronami do powierzania zadań agentom AI. Wraz z dojrzewaniem tych możliwości mogą one zrewolucjonizować automatyzację w różnych branżach i otworzyć zupełnie nowe zastosowania dla asystentów AI.