Google verschiebt die Grenzen der KI-Unterstützung mit der Einführung des Agentenmodus für Gemini und markiert damit einen grundlegenden Wandel von reaktiven Frage-Antwort-Systemen hin zu proaktiven Agenten, die Aufgaben eigenständig abschließen können.
Der auf der Google I/O 2025 angekündigte Agentenmodus ermöglicht es Nutzern, einfach ihre Ziele zu formulieren, woraufhin Gemini intelligent die nötigen Schritte zur Zielerreichung orchestriert. Die Funktion vereint fortschrittliche Fähigkeiten wie Live-Web-Browsing, tiefgehende Recherche und intelligente Integrationen mit Google-Apps, um komplexe, mehrstufige Aufgaben mit minimaler Nutzeraufsicht zu bewältigen.
„Stellen Sie sich vor, Sie nennen einfach Ihr Ziel, und Gemini koordiniert intelligent die Schritte zur Umsetzung“, erklärte Google während der Ankündigung. Die Technologie baut auf Project Mariner auf, Googles experimentellem KI-Agenten, der Informationen auf Browserbildschirmen – darunter Text, Bilder, Formulare und andere Webelemente – verstehen und verarbeiten kann.
Google bringt die Computerbedienungsfunktionen von Project Mariner zudem in die Gemini API und Vertex AI, sodass Entwickler Anwendungen mit diesen agentenbasierten Features erstellen können. Unternehmen wie Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company und Cartwheel erforschen das Potenzial bereits, ein breiterer Zugang für Entwickler ist für diesen Sommer geplant.
Die Technologie demonstriert beeindruckende Fähigkeiten, darunter eine „Lehren-und-Wiederholen“-Funktion: Nutzer können eine Aufgabe einmal vormachen, woraufhin die KI diese lernt und künftig ähnliche Aufgaben selbstständig ausführt. In der Praxis kann der Agentenmodus beispielsweise bei der Wohnungssuche helfen, indem er Angebote auf Plattformen wie Zillow durchsucht, Filter anpasst und sogar Besichtigungstermine nach Nutzerkriterien vereinbart.
Dieser Fortschritt stellt eine bedeutende Weiterentwicklung der Interaktion zwischen Nutzern und KI-Assistenten dar. Anstatt für jeden Schritt einzelne Befehle zu geben, können Nutzer nun ganze Ziele an Gemini delegieren, das die nötigen Aktionen eigenständig plant und umsetzt. Eine experimentelle Version des Agentenmodus wird bald für Google AI Ultra-Abonnenten verfügbar sein. Das Unternehmen betont dabei die Bedeutung von Nutzerkontrolle, Transparenz und Sicherheitsmaßnahmen während des gesamten Nutzungserlebnisses.