Google DeepMind a officiellement lancé Imagen 4, son modèle de génération d’images à partir de texte le plus sophistiqué à ce jour, offrant aux développeurs de puissants nouveaux outils pour la création de visuels générés par IA.
La sortie, disponible depuis le 15 juillet via l’API Gemini et Google AI Studio, introduit deux modèles distincts au sein de la famille Imagen 4. Le modèle standard Imagen 4, proposé à 0,04 $ par image générée, constitue l’offre phare de Google pour une large gamme de tâches de génération d’images. Pour les applications plus exigeantes nécessitant une fidélité accrue aux instructions textuelles, Imagen 4 Ultra offre des capacités renforcées au tarif de 0,06 $ par image.
Imagen 4 marque une avancée majeure par rapport à son prédécesseur, Google mettant en avant sa « clarté remarquable dans les détails fins » tels que les tissus complexes, les gouttes d’eau ou la fourrure animale. Le modèle excelle aussi bien dans les styles photoréalistes qu’abstraits, prenant en charge divers formats d’image et des résolutions allant jusqu’à la 2K.
Mais c’est surtout dans le rendu du texte qu’Imagen 4 se distingue, résolvant un défi persistant de la génération d’images par IA grâce à une amélioration spectaculaire de la typographie. Cette avancée rend la technologie particulièrement précieuse pour la création de supports marketing, d’affiches, d’invitations, de bandes dessinées et d’autres visuels combinant image et texte.
« Imagen 4 représente un énorme bond en avant en termes de qualité », souligne Josh Woodward, responsable du groupe Labs chez Google. « Nous avons accordé beaucoup d’attention et apporté de nombreuses corrections à la génération de texte et de typographie, ce qui en fait un outil remarquable pour créer des diapositives, des invitations ou tout autre support nécessitant une fusion d’images et de texte. »
L’intégration de cette technologie à l’écosystème Google, y compris les applications Workspace, la positionne comme un atout pour accroître la productivité dans de nombreux flux de travail créatifs et professionnels. Google a indiqué que de nouveaux paliers de facturation seront introduits dans les semaines à venir, avec des limites de débit plus élevées disponibles sur demande. L’entreprise prévoit également de lancer une variante plus rapide d’Imagen 4, pouvant fonctionner jusqu’à dix fois plus rapidement qu’Imagen 3.