Google har tillkännagivit en omfattande expansion av sitt AI-system Project Mariner, som nu gör dess datorstyrningsfunktioner tillgängliga för utvecklare via Gemini API och Vertex AI-plattformarna.
Project Mariner, som först presenterades i slutet av 2024, representerar Googles ambitiösa satsning på att förändra hur användare interagerar med digitala gränssnitt med hjälp av AI-agenter. Systemet kan förstå och resonera kring information som visas på en datorskärm, inklusive text, bilder, kod och webbformulär, och kan därefter autonomt navigera på webbplatser och utföra komplexa uppgifter.
Den senaste versionen av Project Mariner har förbättrats avsevärt för att kunna köras på virtuella maskiner i molnet, liknande agenter från OpenAI och Amazon. Detta molnbaserade tillvägagångssätt gör det möjligt för användare att arbeta med andra projekt medan Project Mariner slutför uppgifter i bakgrunden och hanterar upp till tio olika operationer samtidigt—en betydande förbättring jämfört med föregångaren som kördes i webbläsaren.
Flera företag utforskar redan Project Mariners potential, däribland automationsspecialisterna Automation Anywhere och UiPath, samt Browserbase, Autotab, The Interaction Company och Cartwheel. Dessa tidiga användare utnyttjar teknikens förmåga att automatisera komplexa webbaserade arbetsflöden som tidigare krävde omfattande mänsklig inblandning.
Google har också infört avancerade säkerhetsåtgärder för att skydda mot hot som indirekta prompt-injektioner, där skadliga instruktioner kan vara inbäddade i data som AI-modeller hämtar. Enligt Google har dessa säkerhetsförbättringar avsevärt ökat Geminis skyddsnivå vid verktygsanvändning, vilket gör Gemini 2.5 till företagets mest säkra modellfamilj hittills.
Bredare tillgång för utvecklare till Project Mariners funktioner är planerad till sommaren, vilket potentiellt kan revolutionera hur utvecklare bygger AI-applikationer som kan styra och interagera med datorgränssnitt. Tekniken integreras även i Google Sök:s AI-läge, där den initialt kommer att hantera uppgifter som att köpa biljetter till evenemang, boka bord på restauranger och schemalägga lokala möten.