menu
close

Google erweitert KI-Portfolio mit Gemini 2.5 und Imagen 4

Google hat sein KI-Angebot weiter ausgebaut, indem Gemini 2.5 Flash und Pro nun allgemein verfügbar sind und mit Flash-Lite ein besonders kosteneffizientes Modell vorgestellt wurde. Zudem hat das Unternehmen Imagen 4 veröffentlicht, das fortschrittlichste Text-zu-Bild-Modell mit deutlich verbesserten Textdarstellungen. Ergänzt werden diese Neuerungen durch die Einführung der Gemini CLI, einem Open-Source-Tool, das KI direkt in die Terminals von Entwicklern bringt und beim Programmieren sowie Lösen von Problemen unterstützt.
Google erweitert KI-Portfolio mit Gemini 2.5 und Imagen 4

Google hat sein KI-Ökosystem mit mehreren bedeutenden Veröffentlichungen deutlich erweitert und positioniert sich damit an der Spitze der generativen KI-Technologie.

Die Gemini 2.5-Familie ist gewachsen: Sowohl die Flash- als auch die Pro-Modelle sind jetzt für den produktiven Einsatz allgemein verfügbar. Gemini 2.5 Flash und Pro sind nun stabil und allgemein verfügbar, sodass Entwickler mit Zuversicht produktive Anwendungen darauf aufbauen können. Unternehmen wie Spline, Rooms, Snap und SmartBear nutzen diese Versionen bereits seit mehreren Wochen produktiv. Das Wachstum und die Nachfrage nach Gemini 2.5 Pro sind so stark wie bei keinem anderen Google-Modell zuvor, weshalb das Unternehmen die Version 06-05 stabilisiert hat, ohne den Preis zu erhöhen. Google erwartet, dass Pro insbesondere in Szenarien mit höchsten Anforderungen an Intelligenz und Fähigkeiten – etwa beim Programmieren oder bei agentenbasierten Aufgaben – überzeugt.

Zusätzlich hat Google Gemini 2.5 Flash-Lite als Vorschau vorgestellt – das bislang kosteneffizienteste und schnellste 2.5-Modell. Diese neue Variante ist als günstige Option für Aufgaben mit hohem Durchsatz wie Klassifizierung oder großflächige Zusammenfassungen konzipiert und bietet in den meisten Bewertungen bessere Leistung, eine geringere Zeit bis zum ersten Token sowie eine höhere Dekodiergeschwindigkeit (Tokens pro Sekunde). Flash-Lite ist ein Reasoning-Modell, das über einen API-Parameter eine dynamische Steuerung des "Denkbudgets" ermöglicht. Im Gegensatz zu anderen Modellen der Familie ist das Denken standardmäßig deaktiviert, da Flash-Lite auf Kosten- und Geschwindigkeitsoptimierung ausgelegt ist. Dennoch unterstützt es weiterhin alle nativen Tools, darunter Grounding mit Google Search, Codeausführung, URL-Kontext und Funktionsaufrufe.

Im Bereich der Bildgenerierung hat Google Imagen 4 veröffentlicht, das erstmals auf der I/O 2025 im vergangenen Monat vorgestellt wurde. Google bezeichnet es als das bislang "beste Text-zu-Bild-Modell", das eine "deutlich verbesserte Textdarstellung" gegenüber früheren Modellen bietet. Das neue Modell überzeugt durch außergewöhnliche Detailtreue bei feinen Strukturen wie komplexen Stoffen, Wassertropfen oder Tierfell und brilliert sowohl im fotorealistischen als auch im abstrakten Stil. Weitere Verbesserungen umfassen 2K-Auflösung sowie eine optimierte Rechtschreibung und Typografie. Imagen 4 und eine Premium-Variante, Imagen 4 Ultra, stehen zahlenden Vorschau-Nutzern ab sofort über die Gemini API zur Verfügung; in Google AI Studio ist ein begrenzter kostenloser Test möglich. Imagen 4 kostet 0,04 US-Dollar pro generiertem Bild, die Ultra-Version 0,06 US-Dollar pro Bild.

Ergänzt werden diese Veröffentlichungen durch die Gemini CLI, einen Open-Source-KI-Agenten, der die Möglichkeiten von Gemini direkt ins Terminal von Entwicklern bringt – für Programmierung, Problemlösung und Aufgabenmanagement. Nutzer können Gemini 2.5 Pro kostenlos mit einem persönlichen Google-Konto verwenden oder für erweiterten Zugriff Google AI Studio bzw. Vertex AI-Schlüssel nutzen. Die Gemini CLI bietet mit 60 Modellanfragen pro Minute und 1.000 Anfragen pro Tag das branchenweit großzügigste Nutzungskontingent ohne Zusatzkosten. Sie ermöglicht leistungsstarke KI-Funktionen – von Codeverständnis und Dateimanipulation über Befehlsausführung bis hin zu dynamischer Fehlersuche – und stellt ein grundlegendes Upgrade für die Kommandozeilen-Erfahrung dar. So können Nutzer mit natürlicher Sprache Code schreiben, Fehler beheben und Arbeitsabläufe effizienter gestalten.

Diese Veröffentlichungen stärken Googles Position im hart umkämpften KI-Markt und bieten Entwicklern und Anwendern leistungsfähigere, effizientere und zugänglichere Werkzeuge für unterschiedlichste Anwendungsbereiche.

Source:

Latest News