Google împinge limitele asistenței AI prin introducerea modulului Agent pentru Gemini, reprezentând o schimbare fundamentală de la sistemele reactive de tip întrebare-răspuns la agenți proactivi, capabili să finalizeze autonom sarcini.
Agent Mode, anunțat la Google I/O 2025, permite utilizatorilor să-și exprime pur și simplu obiectivele, iar Gemini orchestrează inteligent pașii necesari pentru a le atinge. Funcționalitatea combină capabilități avansate, inclusiv navigare web în timp real, cercetare aprofundată și integrări inteligente cu aplicațiile Google pentru a gestiona sarcini complexe, cu mai mulți pași, cu o supraveghere minimă din partea utilizatorului.
„Imaginați-vă că vă exprimați obiectivul, iar Gemini orchestrează inteligent pașii pentru a-l atinge”, a explicat Google în timpul anunțului. Tehnologia se bazează pe Project Mariner, agentul AI experimental al Google, care poate înțelege și raționa pe baza informațiilor de pe ecranele browserului, inclusiv text, imagini, formulare și alte elemente web.
Google aduce, de asemenea, capabilitățile de utilizare a computerului din Project Mariner în Gemini API și Vertex AI, permițând dezvoltatorilor să creeze aplicații alimentate de aceste funcții agentice. Companii precum Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company și Cartwheel explorează deja potențialul acestora, urmând ca accesul mai larg pentru dezvoltatori să fie disponibil în această vară.
Tehnologia demonstrează capabilități impresionante, inclusiv o funcție „învață și repetă”, prin care utilizatorii pot demonstra o sarcină o singură dată, iar AI-ul va învăța și va putea replica sarcini similare în viitor. În aplicații practice, Agent Mode poate ajuta la căutarea unui apartament, căutând anunțuri pe site-uri precum Zillow, ajustând filtrele și chiar programând vizionări pe baza criteriilor utilizatorului.
Această inovație marchează o evoluție semnificativă în modul în care utilizatorii interacționează cu asistenții AI. În loc să fie necesare comenzi specifice pentru fiecare pas, utilizatorii pot delega acum obiective întregi către Gemini, care determină și execută autonom acțiunile necesare. O versiune experimentală a modulului Agent va fi disponibilă în curând pentru abonații Google AI Ultra, compania subliniind controlul utilizatorului, transparența și măsurile de securitate pe tot parcursul experienței.