Google a anunțat o extindere majoră a sistemului său AI Project Mariner, aducând capabilitățile de control al computerului către dezvoltatori prin intermediul platformelor Gemini API și Vertex AI.
Lansat inițial la sfârșitul anului 2024, Project Mariner reprezintă efortul ambițios al Google de a transforma modul în care utilizatorii interacționează cu interfețele digitale prin agenți AI. Sistemul poate înțelege și raționa pe baza informațiilor afișate pe ecranul unui computer, inclusiv text, imagini, cod și formulare web, apoi poate naviga autonom pe site-uri și finaliza sarcini complexe.
Cea mai recentă versiune a Project Mariner a fost semnificativ îmbunătățită pentru a rula pe mașini virtuale în cloud, similar cu agenții dezvoltați de OpenAI și Amazon. Această abordare bazată pe cloud permite utilizatorilor să lucreze la alte proiecte în timp ce Project Mariner finalizează sarcinile în fundal, gestionând până la zece operațiuni diferite simultan—o îmbunătățire substanțială față de versiunea anterioară care rula în browser.
Mai multe companii explorează deja potențialul Project Mariner, inclusiv specialiștii în automatizare Automation Anywhere și UiPath, alături de Browserbase, Autotab, The Interaction Company și Cartwheel. Acești pionieri valorifică abilitatea tehnologiei de a automatiza fluxuri de lucru complexe bazate pe web, care anterior necesitau intervenție umană extinsă.
Google a implementat, de asemenea, măsuri avansate de securitate pentru a proteja împotriva amenințărilor precum injecțiile indirecte de prompt, unde instrucțiuni malițioase pot fi integrate în datele preluate de modelele AI. Potrivit Google, aceste îmbunătățiri de securitate au crescut semnificativ rata de protecție a Gemini în timpul utilizării instrumentelor, făcând din Gemini 2.5 cea mai sigură familie de modele a companiei de până acum.
Accesul extins pentru dezvoltatori la capabilitățile Project Mariner este programat pentru această vară, cu potențialul de a revoluționa modul în care dezvoltatorii construiesc aplicații AI capabile să controleze și să interacționeze cu interfețele computerelor. Tehnologia este integrată și în modul AI al Google Search, unde inițial va gestiona sarcini precum achiziționarea de bilete la evenimente, rezervarea la restaurante și programarea de întâlniri locale.