menu
close

Google stellt Imagen 4 vor und erweitert das Gemini-2.5-Portfolio

Google hat mit Imagen 4 sein bislang fortschrittlichstes Text-zu-Bild-Modell veröffentlicht, das nun im kostenpflichtigen Vorschauzugang über die Gemini API und Google AI Studio verfügbar ist. Zeitgleich gehen die Gemini-2.5-Modelle Flash und Pro in die allgemeine Verfügbarkeit, während mit Gemini 2.5 Flash-Lite das bislang kosteneffizienteste und schnellste Modell der 2.5-Familie eingeführt wird. Entwickler können Gemini zudem direkt im Terminal über das neu veröffentlichte Open-Source-Tool Gemini CLI nutzen.
Google stellt Imagen 4 vor und erweitert das Gemini-2.5-Portfolio

Google hat seine KI-Fähigkeiten mit der Veröffentlichung von Imagen 4, dem bislang fortschrittlichsten Modell zur Text-zu-Bild-Generierung, deutlich ausgebaut. Das Modell ist ab sofort im kostenpflichtigen Vorschauzugang über die Gemini API und Google AI Studio verfügbar.

Imagen 4 stellt eine erhebliche Verbesserung gegenüber früheren Versionen dar, insbesondere bei der Textdarstellung in generierten Bildern. Es gibt zwei Varianten: das Standardmodell Imagen 4, das mit 0,04 US-Dollar pro generiertem Bild berechnet wird, und Imagen 4 Ultra für 0,06 US-Dollar pro Bild, das eine noch präzisere Umsetzung von Nutzeranweisungen bietet. Beide Modelle verfügen über die SynthID-Wasserzeichen-Technologie, die für das menschliche Auge unsichtbar ist, aber KI-generierte Inhalte kennzeichnet.

Die Veröffentlichung ist Teil einer umfassenderen Erweiterung der Gemini-2.5-Modellfamilie von Google. Nach erfolgreichen Vorschauphasen sind die Modelle Gemini 2.5 Flash und Pro nun allgemein verfügbar. Gleichzeitig startet Gemini 2.5 Flash-Lite in die Vorschau. Flash-Lite ist das bislang kosteneffizienteste und schnellste Modell der 2.5-Reihe und wurde für Aufgaben mit hohem Volumen und geringer Latenz wie Klassifikation, Übersetzung und intelligentes Routing optimiert.

Trotz des Fokus auf Effizienz behält Gemini 2.5 Flash-Lite die zentralen Fähigkeiten der 2.5-Familie bei, darunter ein Kontextfenster von einer Million Token sowie die Unterstützung nativer Tools wie Google-Suche-Integration und Codeausführung. Im Gegensatz zu anderen Modellen der Familie, bei denen das "Denken" standardmäßig aktiviert ist, können Entwickler bei Flash-Lite das Denk-Budget über API-Parameter steuern; standardmäßig ist das Denken deaktiviert, um Geschwindigkeit und Kosten zu optimieren.

Zur weiteren Verbesserung des Angebots für Entwickler hat Google Gemini CLI veröffentlicht – einen Open-Source-KI-Agenten, der Gemini direkt ins Terminal bringt. Damit können Entwickler Gemini 2.5 Pro über eine Kommandozeilenschnittstelle für Programmierung, Problemlösung und Aufgabenmanagement nutzen. Durch die Open-Source-Lizenz (Apache 2.0) können Entwickler den Code einsehen, Sicherheitsaspekte überprüfen und zur Weiterentwicklung beitragen.

Mit diesen aktuellen KI-Veröffentlichungen unterstreicht Google sein Engagement, Entwicklern immer leistungsfähigere und flexiblere Werkzeuge für unterschiedliche Preisklassen und Anwendungsfälle bereitzustellen – von hochwertiger Bildgenerierung über effiziente Textverarbeitung bis hin zu KI-Unterstützung direkt im Terminal.

Source:

Latest News