Google verlegt de grenzen van AI-assistentie met de introductie van de Agent-modus voor Gemini, wat een fundamentele verschuiving betekent van reactieve vraag-en-antwoordsystemen naar proactieve agenten die zelfstandig taken kunnen voltooien.
De Agent-modus, aangekondigd op Google I/O 2025, stelt gebruikers in staat om simpelweg hun doelstellingen te formuleren, waarna Gemini intelligent de benodigde stappen coördineert om deze te bereiken. De functie combineert geavanceerde mogelijkheden, waaronder live web-browsen, diepgaand onderzoek en slimme integraties met Google-apps, om complexe, meerstaps taken met minimale gebruikersinmenging te beheren.
"Stel je voor dat je alleen je doel hoeft te noemen en Gemini intelligent de stappen orkestreert om dat te bereiken," legde Google uit tijdens de aankondiging. De technologie bouwt voort op Project Mariner, Google's experimentele AI-agent die informatie op browsersschermen kan begrijpen en interpreteren, inclusief tekst, afbeeldingen, formulieren en andere webelementen.
Google brengt de computergebruik-mogelijkheden van Project Mariner ook naar de Gemini API en Vertex AI, zodat ontwikkelaars applicaties kunnen bouwen die gebruikmaken van deze agent-achtige functies. Bedrijven als Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company en Cartwheel onderzoeken al het potentieel, met bredere toegang voor ontwikkelaars die deze zomer wordt verwacht.
De technologie toont indrukwekkende mogelijkheden, waaronder een "teach and repeat"-functie waarbij gebruikers een taak één keer kunnen voordoen, waarna de AI vergelijkbare taken in de toekomst kan leren en herhalen. In de praktijk kan de Agent-modus bijvoorbeeld helpen bij het zoeken naar een appartement door advertenties op sites als Zillow te doorzoeken, filters aan te passen en zelfs rondleidingen in te plannen op basis van gebruikerscriteria.
Deze vooruitgang betekent een belangrijke evolutie in de manier waarop gebruikers met AI-assistenten omgaan. In plaats van voor elke stap specifieke opdrachten te moeten geven, kunnen gebruikers nu volledige doelen delegeren aan Gemini, die vervolgens zelfstandig de benodigde acties bepaalt en uitvoert. Een experimentele versie van de Agent-modus zal binnenkort beschikbaar zijn voor Google AI Ultra-abonnees, waarbij het bedrijf de nadruk legt op gebruikerscontrole, transparantie en beveiligingsmaatregelen gedurende de hele ervaring.