Google DeepMind a officiellement lancé Imagen 4, son modèle de génération d’images à partir de texte le plus sophistiqué à ce jour, offrant aux développeurs de puissants nouveaux outils pour créer des visuels générés par l’IA.
La sortie, disponible depuis le 15 juillet via l’API Gemini et Google AI Studio, introduit deux modèles distincts dans la famille Imagen 4. Le modèle standard Imagen 4, offert à 0,04 $ par image générée, constitue l’offre phare de Google pour une vaste gamme de tâches de génération d’images. Pour les applications plus exigeantes nécessitant une fidélité accrue aux instructions textuelles, Imagen 4 Ultra propose des capacités améliorées à 0,06 $ par image.
Imagen 4 marque une avancée majeure par rapport à son prédécesseur, Google mettant en avant sa « clarté remarquable dans les détails fins » tels que les tissus complexes, les gouttelettes d’eau et la fourrure animale. Le modèle excelle tant dans les styles photoréalistes qu’abstraits, prenant en charge divers formats d’image et des résolutions allant jusqu’à 2K.
Mais c’est surtout dans le rendu du texte qu’Imagen 4 se distingue, réglant un défi de longue date en génération d’images par IA grâce à une amélioration spectaculaire de la typographie. Cette avancée rend la technologie particulièrement précieuse pour la création de matériel promotionnel, d’affiches, d’invitations, de bandes dessinées et d’autres visuels combinant images et texte.
« Imagen 4 représente un énorme bond en avant en matière de qualité », souligne Josh Woodward, responsable du groupe Labs chez Google. « Nous avons porté une attention particulière à la façon dont le modèle génère le texte et la typographie, ce qui le rend idéal pour créer des diapositives, des invitations ou tout autre contenu nécessitant une fusion d’images et de texte. »
L’intégration de cette technologie à l’écosystème Google, y compris les applications Workspace, lui permet d’améliorer la productivité dans divers flux de travail créatifs et professionnels. Google a indiqué que d’autres paliers de tarification seront proposés dans les prochaines semaines, avec des limites de débit plus élevées disponibles sur demande. L’entreprise prévoit également de lancer une version accélérée d’Imagen 4, jusqu’à dix fois plus rapide qu’Imagen 3.