Google a considérablement renforcé ses capacités en intelligence artificielle avec la sortie d’Imagen 4, son modèle de génération d’images à partir de texte le plus avancé, désormais proposé en aperçu payant via l’API Gemini et Google AI Studio.
Imagen 4 marque une nette amélioration par rapport aux versions précédentes, notamment en ce qui concerne la qualité du rendu du texte dans les images générées. Deux variantes sont proposées : le modèle standard Imagen 4, facturé 0,04 $ par image produite, et Imagen 4 Ultra à 0,06 $ par image, offrant une précision accrue dans le respect des instructions des utilisateurs. Les deux modèles intègrent la technologie de filigrane SynthID, invisible à l’œil nu mais permettant d’identifier les contenus générés par l’IA.
Cette sortie s’inscrit dans le cadre de l’élargissement de la famille de modèles Gemini 2.5 de Google. L’entreprise a rendu les modèles Gemini 2.5 Flash et Pro disponibles de manière générale après des périodes d’aperçu réussies, tout en introduisant Gemini 2.5 Flash-Lite en aperçu. Flash-Lite se positionne comme le modèle 2.5 le plus rapide et économique de Google, optimisé pour les tâches à fort volume et sensibles à la latence telles que la classification, la traduction et le routage intelligent.
Malgré son orientation vers l’efficacité, Gemini 2.5 Flash-Lite conserve les principales capacités de la famille 2.5, notamment une fenêtre de contexte d’un million de tokens et la prise en charge d’outils natifs comme l’intégration à Google Search et l’exécution de code. Contrairement aux autres modèles de la gamme qui activent par défaut les capacités de réflexion, Flash-Lite permet aux développeurs de contrôler le budget de réflexion via des paramètres API, avec la réflexion désactivée par défaut pour optimiser la rapidité et le coût.
Pour renforcer encore son offre à destination des développeurs, Google a lancé Gemini CLI, un agent IA open source qui permet d’accéder à Gemini directement depuis le terminal. Cet outil donne accès à Gemini 2.5 Pro via une interface en ligne de commande pour le codage, la résolution de problèmes et la gestion de tâches. Le caractère open source de Gemini CLI (sous licence Apache 2.0) permet aux développeurs d’inspecter le code, de vérifier les implications en matière de sécurité et de contribuer à son évolution.
Les dernières nouveautés IA de Google témoignent de son engagement à fournir aux développeurs des outils toujours plus puissants et flexibles, adaptés à différents usages et budgets, allant de la génération d’images de haute qualité au traitement de texte efficace, en passant par l’assistance IA en ligne de commande.