Google wagt einen großen Schritt in die Welt der KI-Agenten mit der Einführung des Agentenmodus für seine Gemini-Plattform, der auf der Entwicklerkonferenz Google I/O 2025 am 20. Mai vorgestellt wurde.
Der Agentenmodus, angetrieben von Googles Project Mariner-Technologie, verwandelt Gemini in einen autonomen Assistenten, der komplexe, mehrstufige Aufgaben mit minimaler Nutzeraufsicht ausführen kann. Das Feature ermöglicht es Gemini, Websites zu durchsuchen, visuelle und textuelle Elemente zu interpretieren und im Namen der Nutzer Aktionen auszuführen.
„Stellen Sie sich vor, Sie nennen einfach Ihr Ziel, und Gemini orchestriert intelligent die Schritte, um es zu erreichen“, erklärte Google in seiner Ankündigung. „Der Agentenmodus kombiniert nahtlos fortschrittliche Funktionen wie Live-Web-Browsing, tiefgehende Recherche und smarte Integrationen mit Ihren Google-Apps.“
In einer Demonstration während der Keynote zeigte Google-CEO Sundar Pichai, wie der Agentenmodus die Wohnungssuche vereinfachen kann. Die KI kann Inserate auf Zillow anhand von Nutzerkriterien durchsuchen, Filter anpassen und sogar Besichtigungstermine vereinbaren – und das alles, ohne dass der Nutzer mehrere Websites besuchen oder Details manuell verwalten muss.
Die Technologie läuft auf cloudbasierten virtuellen Maschinen und kann bis zu zehn Aufgaben gleichzeitig verwalten, sodass Nutzer sich auf andere Aktivitäten konzentrieren können, während Gemini zeitaufwändige Prozesse im Hintergrund übernimmt. Diese Fähigkeit stellt einen bedeutenden Fortschritt darin dar, wie Nutzer künftig mit dem Internet interagieren könnten.
Im Zuge einer branchenweiten Standardisierung kündigte Google zudem die Kompatibilität zwischen seiner Gemini API/SDK und dem von Anthropic eingeführten Model Context Protocol (MCP) an. MCP ist ein offener Standard, der es KI-Assistenten ermöglicht, über ein einheitliches Protokoll mit externen Tools, Datenquellen und Systemen zu interagieren.
„MCP ist ein gutes Protokoll und entwickelt sich rasch zu einem offenen Standard für das agentische KI-Zeitalter“, sagte Demis Hassabis, CEO von Google DeepMind, und unterstrich das Engagement des Unternehmens, MCP gemeinsam mit Anthropic und weiteren Branchenpartnern weiterzuentwickeln.
Der Agentenmodus wird zunächst für Google AI Ultra-Abonnenten in den USA verfügbar sein, mit Plänen zur baldigen Ausweitung auf weitere Länder. Zudem bringt das Unternehmen die Fähigkeiten von Project Mariner diesen Sommer über die Gemini API zu Entwicklern, wobei vertrauenswürdige Tester wie Automation Anywhere und UiPath bereits mit der Technologie arbeiten.