Googles jährliche Entwicklerkonferenz zeigte erneut das anhaltende Engagement des Unternehmens für KI-Innovationen, wobei Project Astra und der KI-Modus als Highlights der I/O 2025 hervortraten.
Project Astra, das im vergangenen Jahr erstmals als Forschungsprototyp vorgestellt wurde, hat sich zu einem leistungsstarken, universellen KI-Assistenten entwickelt, der die Welt um die Nutzer herum versteht. Gemini Live integriert nun die Kamera- und Bildschirmfreigabefunktionen von Project Astra und ermöglicht es Nutzern, auf intuitivere Weise über ihre Geräte mit der KI zu interagieren. Diese Funktionen werden ab dieser Woche für alle Nutzer auf iOS und Android bereitgestellt und erlauben nahezu in Echtzeit geführte Sprachunterhaltungen mit Gemini, während Video von Smartphone-Kameras oder Bildschirmen gestreamt wird. In den kommenden Wochen wird Gemini Live noch tiefer in das Google-Ökosystem integriert, um beispielsweise Wegbeschreibungen aus Maps, das Erstellen von Kalendereinträgen und To-do-Listen mit Tasks zu ermöglichen.
Der KI-Modus, Googles KI-gestützte Suchfunktion, wird nun für alle Nutzer in den USA direkt in der Suche ausgerollt, mit einer sofortigen Opt-in-Möglichkeit über Labs. Für Nutzer, die umfassendere Antworten wünschen, führt Google mit Deep Search erweiterte Recherchefunktionen in den KI-Modus ein. Diese leistungsstarke Funktion kann Hunderte von Suchanfragen ausführen, Informationen aus unterschiedlichen Quellen verknüpfen und innerhalb von Minuten Expertenberichte mit vollständigen Quellenangaben erstellen – und so potenziell stundenlange Recherchearbeit einsparen.
Eine weitere wichtige Ankündigung ist die Integration der Fähigkeiten von Project Astra in den KI-Modus über Search Live, die im Sommer erscheint. Damit können Nutzer in Echtzeit mit der Suche über das sprechen, was sie durch ihre Kamera sehen. Bei Nutzung des KI-Modus oder von Lens können Nutzer auf den "Live"-Button klicken, um Fragen zu dem zu stellen, was sie sehen. Project Astra streamt dabei Live-Video und Audio in ein KI-Modell, das mit minimaler Verzögerung antwortet.
Zudem bringt Google agentenbasierte Funktionen aus Project Mariner in den KI-Modus in Labs – zunächst für Event-Tickets, Restaurantreservierungen und lokale Termine. In einer Demonstration fand und reservierte der KI-Modus blitzschnell Baseball-Tickets und leitete die Nutzer direkt zum Checkout – ein Beispiel dafür, wie KI komplexe, mehrstufige Aufgaben mühelos übernimmt.
Laut Google markieren diese Entwicklungen eine neue Phase des KI-Plattformwandels, in der jahrzehntelange Forschung nun für Menschen, Unternehmen und Gemeinschaften weltweit Realität wird. Mit bedeutenden Upgrades für die Gemini 2.5 Pro- und Flash-Modelle spiegeln die Ankündigungen der Google I/O 2025 die Vision des Unternehmens wider, intuitivere, leistungsfähigere und personalisierte KI-Erlebnisse im gesamten Produkt-Ökosystem zu schaffen.