Google hat sein Imagen 4 Ultra-Modell still und leise, aber maßgeblich aufgerüstet und damit eines der weltweit führenden KI-Bildgenerierungssysteme geschaffen. Das verbesserte Modell belegt nun den dritten Platz auf dem Image Arena-Leaderboard von Artificial Analysis und positioniert sich damit als direkter Konkurrent zu den Branchenführern OpenAIs GPT-4o und ByteDances Seedream 3.0.
Erstmals vorgestellt auf der Google I/O 2025 im Mai, markiert Imagen 4 Ultra einen erheblichen Fortschritt gegenüber seinem Vorgänger. Das Modell brilliert bei der Darstellung feinster Details wie Stoffstrukturen, Wassertropfen und Tierfell mit beeindruckender Klarheit. Nutzer berichten von deutlichen Verbesserungen sowohl bei fotorealistischen als auch abstrakten Bildstilen; das Modell kann Bilder mit Auflösungen von bis zu 2K generieren.
Eine der auffälligsten Neuerungen von Imagen 4 Ultra betrifft ein langjähriges Problem der KI-Bildgenerierung: die Textdarstellung. Das Modell zeigt deutlich verbesserte typografische Fähigkeiten und eignet sich damit besonders für die Erstellung von Grußkarten, Postern und anderen Designs, die Bild und Text kombinieren.
Google stellt Imagen 4 Ultra über verschiedene Kanäle bereit, darunter die Gemini-App, Google AI Studio und Vertex AI für Unternehmenskunden. Mit einem Preis von 0,06 US-Dollar pro generiertem Bild ist das Modell im Vergleich zu GPT-4o (ca. 0,17 US-Dollar pro Bild) wettbewerbsfähig und liefert Ergebnisse in etwa 9,5 Sekunden – gegenüber 53 Sekunden bei GPT-4o.
Das Upgrade unterstreicht Googles Entschlossenheit, im Bereich der generativen KI an der Spitze mitzuspielen. Branchenanalysten zufolge zeigt die kontinuierliche Weiterentwicklung der Imagen-Familie durch Google DeepMind das klare Bekenntnis des Unternehmens, die Grenzen des Machbaren bei KI-generierten visuellen Inhalten stetig zu verschieben.
Für die Zukunft hat Google angekündigt, dass kommende Updates für Imagen 4 Ultra insbesondere auf die Integration von Nutzerfeedback zur weiteren Verfeinerung der Modellfähigkeiten sowie auf die Reduzierung der Generierungszeit abzielen. Zudem arbeitet das Unternehmen an einer „Fast“-Version von Imagen 4, die bis zu zehnmal schneller als Imagen 3 sein und den Nutzen für Echtzeitanwendungen weiter steigern soll.