Google a discrètement mais significativement bonifié son modèle Imagen 4 Ultra, le positionnant parmi les meilleurs systèmes mondiaux de génération d’images par intelligence artificielle. Ce modèle amélioré occupe désormais la troisième place du classement Image Arena d’Artificial Analysis, devenant ainsi un concurrent direct des chefs de file du secteur, GPT-4o d’OpenAI et Seedream 3.0 de ByteDance.
Dévoilé pour la première fois lors de Google I/O 2025 en mai, Imagen 4 Ultra représente une avancée majeure par rapport à son prédécesseur. Le modèle excelle dans le rendu de détails complexes comme les textures de tissus, les gouttelettes d’eau ou la fourrure animale, avec une clarté impressionnante. Les utilisateurs ont noté des améliorations significatives tant dans les styles d’images photoréalistes qu’abstraits, le modèle étant capable de générer des images jusqu’à une résolution de 2K.
L’une des améliorations les plus notables d’Imagen 4 Ultra concerne un défi de longue date en génération d’images par IA : le rendu du texte. Le modèle affiche des capacités typographiques nettement supérieures, ce qui le rend particulièrement utile pour la création de cartes de vœux, d’affiches et d’autres designs combinant images et texte.
Google propose Imagen 4 Ultra sur plusieurs plateformes, notamment l’application Gemini, Google AI Studio et Vertex AI pour les clients d’entreprise. À 0,06 $ par image générée, l’offre est concurrentielle par rapport au coût d’environ 0,17 $ par image de GPT-4o, tout en livrant les résultats en environ 9,5 secondes contre 53 secondes pour GPT-4o.
Cette mise à niveau témoigne de la volonté de Google de rivaliser au plus haut niveau dans le domaine de l’IA générative. Selon les analystes du secteur, le raffinement continu de la famille Imagen par Google DeepMind démontre l’engagement de l’entreprise à repousser les limites du contenu visuel généré par l’IA.
Pour l’avenir, Google indique que les prochaines mises à jour d’Imagen 4 Ultra viseront à intégrer davantage les commentaires des utilisateurs afin d’affiner encore les capacités du modèle, tout en travaillant à réduire la latence de génération. L’entreprise développe également une version « Rapide » d’Imagen 4, qui promet d’être jusqu’à 10 fois plus rapide qu’Imagen 3, ce qui en accroîtrait l’utilité pour les applications en temps réel.