menu
close

Google bringt Imagen 4 mit revolutionärer Texterstellung auf den Markt

Google hat Imagen 4 veröffentlicht, sein bislang fortschrittlichstes Text-zu-Bild-KI-Modell, das Entwicklern ab dem 15. Juli 2025 über die Gemini API und Google AI Studio zur Verfügung steht. Die neueste Version bietet deutliche Verbesserungen bei der Bildqualität, insbesondere bei der Darstellung von Text, und führt zwei Modellvarianten ein, um unterschiedlichen kreativen Anforderungen gerecht zu werden. Die Technologie ermöglicht es Entwicklern, aus Textbeschreibungen hochdetaillierte Visualisierungen zu erzeugen – mit Anwendungsbereichen in Design, Marketing, Unterhaltung und anderen kreativen Feldern.
Google bringt Imagen 4 mit revolutionärer Texterstellung auf den Markt

Google DeepMind hat offiziell Imagen 4 vorgestellt, das bislang ausgereifteste Modell zur Text-zu-Bild-Generierung und stellt Entwicklern damit leistungsstarke neue Werkzeuge für KI-generierte Visualisierungen zur Verfügung.

Die Veröffentlichung, die ab dem 15. Juli sowohl über die Gemini API als auch über Google AI Studio verfügbar ist, umfasst zwei unterschiedliche Modelle innerhalb der Imagen-4-Familie. Das Standardmodell Imagen 4, das mit 0,04 US-Dollar pro generiertem Bild bepreist ist, dient als Googles Flaggschiff für ein breites Spektrum an Bildgenerierungsaufgaben. Für anspruchsvollere Anwendungen, die eine besonders präzise Umsetzung von Texteingaben erfordern, bietet Imagen 4 Ultra erweiterte Funktionen zu einem Preis von 0,06 US-Dollar pro Bild.

Imagen 4 stellt einen bedeutenden Fortschritt gegenüber dem Vorgänger dar. Google hebt insbesondere die „bemerkenswerte Klarheit bei feinen Details“ hervor, etwa bei komplexen Stoffen, Wassertropfen oder Tierfell. Das Modell überzeugt sowohl bei fotorealistischen als auch bei abstrakten Stilen und unterstützt verschiedene Seitenverhältnisse sowie Auflösungen bis zu 2K.

Besonders hervorzuheben ist die deutlich verbesserte Texterstellung, mit der Imagen 4 ein dauerhaftes Problem der KI-Bildgenerierung adressiert. Diese Verbesserung macht die Technologie besonders wertvoll für die Erstellung von Marketingmaterialien, Plakaten, Einladungen, Comics und anderen Visuals, die Bild und Text kombinieren.

„Imagen 4 ist ein riesiger Qualitätssprung“, betont Josh Woodward, Leiter der Google Labs-Gruppe. „Wir haben viel Aufmerksamkeit und Verbesserungen darauf verwendet, wie das Modell Text und Typografie generiert. Es eignet sich daher hervorragend für die Erstellung von Folien, Einladungen oder alles, was eine Kombination aus Bild und Text erfordert.“

Die Integration der Technologie in das Google-Ökosystem, einschließlich der Workspace-Anwendungen, soll die Produktivität in verschiedenen kreativen und professionellen Workflows steigern. Google kündigte zudem an, in den kommenden Wochen weitere Preismodelle einzuführen und auf Anfrage höhere Nutzungslimits bereitzustellen. Außerdem ist eine schnellere Variante von Imagen 4 geplant, die bis zu zehnmal schneller arbeiten könnte als Imagen 3.

Source:

Latest News