menu
close

Google ermöglicht Entwicklern KI-gesteuerte Computersteuerung mit Gemini

Google integriert die Computersteuerungsfunktionen von Project Mariner in die Gemini API und Vertex AI, wodurch KI direkt mit Computersystemen interagieren und diese steuern kann. Diese Entwicklung erlaubt es der KI, komplexe webbasierte Aufgaben autonom auszuführen. Unternehmen wie Automation Anywhere, UiPath und Browserbase erforschen bereits das Potenzial dieser Technologie. Ab Sommer wird sie Entwicklern breiter zum Experimentieren zur Verfügung stehen und markiert einen bedeutenden Schritt in Richtung KI-gestützter Automatisierung.
Google ermöglicht Entwicklern KI-gesteuerte Computersteuerung mit Gemini

Google hat einen bedeutenden Fortschritt im Bereich der KI-Fähigkeiten angekündigt, indem die Computersteuerungsfunktionen von Project Mariner in die Gemini API und die Vertex AI Plattformen integriert werden. Diese Integration stellt eine wesentliche Weiterentwicklung dar, wie KI mit digitalen Umgebungen, insbesondere Webbrowsern und Computersystemen, interagieren kann.

Project Mariner, das erstmals Ende 2024 als Forschungsprototyp von Google DeepMind vorgestellt wurde, wurde erheblich weiterentwickelt und ist nun ein leistungsstarkes KI-Agentensystem. Die aktualisierte Version kann jetzt bis zu zehn verschiedene Aufgaben gleichzeitig bewältigen und arbeitet über cloudbasierte virtuelle Maschinen, anstatt direkt im Browser des Nutzers. So können Anwender weiterarbeiten, während die KI Aufgaben im Hintergrund erledigt.

Die Technologie ermöglicht es der KI, den Bildschirminhalt zu erfassen, komplexe Ziele zu interpretieren, umsetzbare Schritte zu planen und diese durch Interaktion mit Websites und Anwendungen auszuführen. Sie kann eine Vielzahl von Aufgaben übernehmen, darunter Informationsrecherche, Buchungen, das Ausfüllen von Formularen und sogar das Abschließen von Käufen mit Nutzerbestätigung.

Mehrere Unternehmen erforschen bereits das Potenzial dieser Technologie. Automation Anywhere und UiPath nutzen sie zur Automatisierung von Geschäftsprozessen, während neuere Akteure wie Browserbase, Autotab, The Interaction Company und Cartwheel innovative Anwendungen entwickeln. Google plant, diese Möglichkeiten ab Sommer Entwicklern breiter zugänglich zu machen.

"Computersteuerung ist Teil eines umfassenderen Werkzeugkastens, den wir für ein florierendes Agenten-Ökosystem benötigen", sagte Google-CEO Sundar Pichai während der Google I/O 2025 Keynote. Das Unternehmen arbeitet zudem an ergänzenden Technologien wie dem Agent2Agent-Protokoll, das die Kommunikation zwischen Agenten ermöglichen soll.

Die Auswirkungen dieser Technologie sind weitreichend. Für Unternehmen verspricht sie eine gesteigerte Produktivität durch die Automatisierung repetitiver Aufgaben. Für Entwickler eröffnen sich neue Möglichkeiten, KI-unterstützte Workflows und Anwendungen zu schaffen, die mit bestehender Software interagieren können. Für Endnutzer könnte sich die Art und Weise, wie sie alltägliche digitale Aufgaben erledigen, grundlegend verändern, da die KI einen Großteil der mühsamen Arbeit übernimmt.

Derzeit ist der Zugang zu Project Mariner auf Google AI Ultra-Abonnenten in den USA beschränkt, die 249,99 US-Dollar pro Monat für den Dienst zahlen. Mit der Weiterentwicklung der Technologie und ihrer Integration in weitere Google-Produkte im Laufe des Jahres 2025 dürfte ihr Einfluss jedoch zunehmend die digitale Landschaft prägen.

Source:

Latest News