Google udostępnia deweloperom sterowanie komputerem przez AI dzięki Gemini

Google integruje możliwości sterowania komputerem z Project Mariner z API Gemini oraz Vertex AI, umożliwiając deweloperom tworzenie aplikacji, które autonomicznie poruszają się po interfejsach internetowych i nimi zarządzają. Firmy takie jak Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company oraz Cartwheel już testują te rozwiązania, a szerszy dostęp dla deweloperów zaplanowano na lato. To rozszerzenie stanowi istotny krok naprzód w technologii agentów AI Google.

Google ogłosiło znaczące rozszerzenie systemu AI Project Mariner, udostępniając jego możliwości sterowania komputerem deweloperom za pośrednictwem platform Gemini API oraz Vertex AI.

Po raz pierwszy zaprezentowany pod koniec 2024 roku Project Mariner to ambitna inicjatywa Google, mająca na celu zrewolucjonizowanie sposobu, w jaki użytkownicy wchodzą w interakcję z cyfrowymi interfejsami za pomocą agentów AI. System ten potrafi rozumieć i analizować informacje wyświetlane na ekranie komputera, w tym tekst, obrazy, kod oraz formularze internetowe, a następnie autonomicznie poruszać się po stronach internetowych i wykonywać złożone zadania.

Najnowsza wersja Project Mariner została znacząco ulepszona i działa teraz na maszynach wirtualnych w chmurze, podobnie jak agenci OpenAI i Amazona. Takie podejście umożliwia użytkownikom realizację innych projektów, podczas gdy Project Mariner wykonuje zadania w tle, obsługując nawet dziesięć różnych operacji jednocześnie — to duży postęp w porównaniu do wcześniejszej wersji, która działała jedynie w przeglądarce.

Z potencjału Project Mariner korzystają już m.in. specjaliści od automatyzacji z Automation Anywhere i UiPath, a także Browserbase, Autotab, The Interaction Company oraz Cartwheel. Wczesni użytkownicy wykorzystują technologię do automatyzacji skomplikowanych procesów internetowych, które wcześniej wymagały dużego zaangażowania człowieka.

Google wdrożyło również zaawansowane mechanizmy bezpieczeństwa, chroniące m.in. przed zagrożeniami typu pośrednie wstrzykiwanie poleceń (indirect prompt injections), gdzie szkodliwe instrukcje mogą być ukryte w danych pobieranych przez modele AI. Według Google, te ulepszenia znacząco zwiększyły skuteczność ochrony Gemini podczas korzystania z narzędzi, czyniąc rodzinę modeli Gemini 2.5 najbezpieczniejszą w historii firmy.

Szerszy dostęp deweloperów do możliwości Project Mariner zaplanowano na lato, co może zrewolucjonizować sposób tworzenia aplikacji AI sterujących i obsługujących interfejsy komputerowe. Technologia ta zostanie również zintegrowana z trybem AI w wyszukiwarce Google, gdzie początkowo będzie obsługiwać zadania takie jak zakup biletów na wydarzenia, rezerwacje w restauracjach oraz umawianie lokalnych wizyt.

Source:

Google udostępnia deweloperom sterowanie komputerem przez AI dzięki Gemini

Latest News

Doubao AI od ByteDance oferuje teraz asystę wideo w czasie rzeczywistym

OnePlus rezygnuje z suwaka Alert Slider na rzecz przycisku Plus Key zasilanego AI

Niemieckie giganty technologiczne łączą siły na rzecz wspieranej przez UE gigafabryki AI

Amerykańscy prokuratorzy badali Builder.ai przed upadkiem startupu AI wycenianego na 1,5 mld dolarów

Fundusz Norwegii o wartości 1,8 biliona dolarów czyni AI obowiązkowym narzędziem dla pracowników

OpenTools.ai prezentuje AI News Hub dla profesjonalistów z branży technologicznej

Google ulepsza modele Gemini dzięki przejrzystym podsumowaniom toku rozumowania

Google rozszerza kontrolę kosztów AI na Gemini 2.5 Pro

Google udostępnia deweloperom sterowanie komputerem przez AI dzięki Gemini

Related Articles

Doubao AI od ByteDance oferuje teraz asystę wideo w czasie rzeczywistym

Google ulepsza modele Gemini dzięki przejrzystym podsumowaniom toku rozumowania

Google rozszerza kontrolę kosztów AI na Gemini 2.5 Pro

Google wskrzesza inteligentne okulary z tłumaczeniem w czasie rzeczywistym dzięki Gemini

Modele Claude 4 od Anthropic ustanawiają nowy standard w kodowaniu AI

Latest News

Doubao AI od ByteDance oferuje teraz asystę wideo w czasie rzeczywistym

OnePlus rezygnuje z suwaka Alert Slider na rzecz przycisku Plus Key zasilanego AI

Niemieckie giganty technologiczne łączą siły na rzecz wspieranej przez UE gigafabryki AI

Amerykańscy prokuratorzy badali Builder.ai przed upadkiem startupu AI wycenianego na 1,5 mld dolarów

Fundusz Norwegii o wartości 1,8 biliona dolarów czyni AI obowiązkowym narzędziem dla pracowników

OpenTools.ai prezentuje AI News Hub dla profesjonalistów z branży technologicznej

Google ulepsza modele Gemini dzięki przejrzystym podsumowaniom toku rozumowania

Google rozszerza kontrolę kosztów AI na Gemini 2.5 Pro