menu
close

Googles Gemini Agent-läge: AI-assistenter utvecklas från reaktiva till proaktiva

Google har presenterat Agent-läge, en banbrytande funktion för Gemini som gör det möjligt för användare att enkelt beskriva sina slutmål och låta AI:n självständigt utföra komplexa uppgifter åt dem. Denna experimentella kapacitet bygger på Project Mariners teknik för datoranvändning, som även integreras i Gemini API och Vertex AI för utvecklare. Flera företag, däribland Automation Anywhere, UiPath och Browserbase, utforskar redan dess potential för att omvandla automatiseringsflöden.
Googles Gemini Agent-läge: AI-assistenter utvecklas från reaktiva till proaktiva

Google flyttar fram gränserna för AI-assistans med introduktionen av Agent-läge för Gemini, vilket markerar ett grundläggande skifte från reaktiva fråge-svar-system till proaktiva agenter som kan slutföra uppgifter autonomt.

Agent-läge, som presenterades på Google I/O 2025, gör det möjligt för användare att enkelt ange sina mål och låta Gemini intelligent samordna de nödvändiga stegen för att uppnå dem. Funktionen kombinerar avancerade möjligheter som live-webbsurfning, djupgående research och smarta integrationer med Google-appar för att hantera komplexa, flerstegsuppgifter med minimalt användarengagemang.

"Föreställ dig att du bara anger ditt mål, och Gemini samordnar intelligent stegen för att nå det", förklarade Google under tillkännagivandet. Tekniken bygger vidare på Project Mariner, Googles experimentella AI-agent som kan förstå och resonera kring information på webbläsarskärmar, inklusive text, bilder, formulär och andra webbelement.

Google för även över Project Mariners datoranvändningsfunktioner till Gemini API och Vertex AI, vilket gör det möjligt för utvecklare att bygga applikationer med dessa agentbaserade funktioner. Företag som Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company och Cartwheel utforskar redan dess potential, och bredare tillgång för utvecklare planeras till sommaren.

Teknologin visar upp imponerande förmågor, däribland en "lär och upprepa"-funktion där användare kan visa en uppgift en gång, så att AI:n kan lära sig och replikera liknande uppgifter i framtiden. I praktiken kan Agent-läge exempelvis hjälpa till med bostadssök genom att leta annonser på sajter som Zillow, justera filter och till och med boka visningar utifrån användarens kriterier.

Detta framsteg innebär en betydande utveckling i hur användare interagerar med AI-assistenter. Istället för att behöva ge specifika kommandon för varje steg kan användare nu överlåta hela mål till Gemini, som självständigt avgör och genomför de nödvändiga åtgärderna. En experimentell version av Agent-läge blir snart tillgänglig för Google AI Ultra-prenumeranter, där företaget betonar användarkontroll, transparens och säkerhetsåtgärder genom hela upplevelsen.

Source:

Latest News