menu
close

Google udostępnia deweloperom sterowanie komputerem przez AI dzięki Gemini

Google integruje możliwości sterowania komputerem z Project Mariner z API Gemini oraz Vertex AI, umożliwiając deweloperom tworzenie aplikacji, które autonomicznie poruszają się po interfejsach internetowych i nimi zarządzają. Firmy takie jak Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company oraz Cartwheel już testują te rozwiązania, a szerszy dostęp dla deweloperów zaplanowano na lato. To rozszerzenie stanowi istotny krok naprzód w technologii agentów AI Google.
Google udostępnia deweloperom sterowanie komputerem przez AI dzięki Gemini

Google ogłosiło znaczące rozszerzenie systemu AI Project Mariner, udostępniając jego możliwości sterowania komputerem deweloperom za pośrednictwem platform Gemini API oraz Vertex AI.

Po raz pierwszy zaprezentowany pod koniec 2024 roku Project Mariner to ambitna inicjatywa Google, mająca na celu zrewolucjonizowanie sposobu, w jaki użytkownicy wchodzą w interakcję z cyfrowymi interfejsami za pomocą agentów AI. System ten potrafi rozumieć i analizować informacje wyświetlane na ekranie komputera, w tym tekst, obrazy, kod oraz formularze internetowe, a następnie autonomicznie poruszać się po stronach internetowych i wykonywać złożone zadania.

Najnowsza wersja Project Mariner została znacząco ulepszona i działa teraz na maszynach wirtualnych w chmurze, podobnie jak agenci OpenAI i Amazona. Takie podejście umożliwia użytkownikom realizację innych projektów, podczas gdy Project Mariner wykonuje zadania w tle, obsługując nawet dziesięć różnych operacji jednocześnie — to duży postęp w porównaniu do wcześniejszej wersji, która działała jedynie w przeglądarce.

Z potencjału Project Mariner korzystają już m.in. specjaliści od automatyzacji z Automation Anywhere i UiPath, a także Browserbase, Autotab, The Interaction Company oraz Cartwheel. Wczesni użytkownicy wykorzystują technologię do automatyzacji skomplikowanych procesów internetowych, które wcześniej wymagały dużego zaangażowania człowieka.

Google wdrożyło również zaawansowane mechanizmy bezpieczeństwa, chroniące m.in. przed zagrożeniami typu pośrednie wstrzykiwanie poleceń (indirect prompt injections), gdzie szkodliwe instrukcje mogą być ukryte w danych pobieranych przez modele AI. Według Google, te ulepszenia znacząco zwiększyły skuteczność ochrony Gemini podczas korzystania z narzędzi, czyniąc rodzinę modeli Gemini 2.5 najbezpieczniejszą w historii firmy.

Szerszy dostęp deweloperów do możliwości Project Mariner zaplanowano na lato, co może zrewolucjonizować sposób tworzenia aplikacji AI sterujących i obsługujących interfejsy komputerowe. Technologia ta zostanie również zintegrowana z trybem AI w wyszukiwarce Google, gdzie początkowo będzie obsługiwać zadania takie jak zakup biletów na wydarzenia, rezerwacje w restauracjach oraz umawianie lokalnych wizyt.

Source:

Latest News