menu
close

Google dévoile Imagen 4 et élargit la gamme Gemini 2.5

Google a lancé Imagen 4, son modèle texte-image le plus avancé à ce jour, désormais offert en aperçu payant via l’API Gemini et Google AI Studio. Ce lancement coïncide avec la disponibilité générale des modèles Gemini 2.5 Flash et Pro, ainsi que l’introduction de Gemini 2.5 Flash-Lite, le modèle le plus rapide et économique de la famille 2.5. Les développeurs peuvent aussi accéder à Gemini directement dans leur terminal grâce au nouveau Gemini CLI, un outil libre et ouvert.
Google dévoile Imagen 4 et élargit la gamme Gemini 2.5

Google a considérablement élargi ses capacités en intelligence artificielle avec la sortie d’Imagen 4, son modèle de génération d’images à partir de texte le plus avancé, maintenant disponible en aperçu payant via l’API Gemini et Google AI Studio.

Imagen 4 représente une amélioration notable par rapport aux versions précédentes, notamment en ce qui concerne la qualité du rendu du texte dans les images générées. Deux variantes sont proposées : le modèle standard Imagen 4, offert à 0,04 $ par image générée, et Imagen 4 Ultra à 0,06 $ par image, qui offre une précision accrue dans le respect des instructions de l’utilisateur. Les deux modèles intègrent la technologie de filigrane SynthID, invisible à l’œil nu mais permettant d’identifier le contenu généré par l’IA.

Cette sortie s’inscrit dans l’expansion plus large de la famille de modèles Gemini 2.5 de Google. L’entreprise a rendu les modèles Gemini 2.5 Flash et Pro généralement disponibles après des périodes d’essai concluantes, tout en introduisant Gemini 2.5 Flash-Lite en aperçu. Flash-Lite est présenté comme le modèle 2.5 le plus économique et le plus rapide de Google, optimisé pour des tâches à grand volume et sensibles à la latence, telles que la classification, la traduction et le routage intelligent.

Malgré son accent sur l’efficacité, Gemini 2.5 Flash-Lite conserve les principales capacités de la famille 2.5, incluant une fenêtre de contexte d’un million de jetons et la prise en charge d’outils natifs comme l’intégration à la recherche Google et l’exécution de code. Contrairement aux autres modèles de la famille qui activent par défaut les capacités de réflexion, Flash-Lite permet aux développeurs de contrôler le budget de réflexion via des paramètres API, la réflexion étant désactivée par défaut pour optimiser la rapidité et les coûts.

Pour enrichir davantage son offre destinée aux développeurs, Google a lancé Gemini CLI, un agent IA libre et ouvert qui amène Gemini directement dans le terminal. Cet outil permet aux développeurs d’accéder à Gemini 2.5 Pro via une interface en ligne de commande pour la programmation, la résolution de problèmes et la gestion de tâches. Le caractère libre et ouvert de Gemini CLI (sous licence Apache 2.0) permet aux développeurs d’inspecter le code, de vérifier les implications en matière de sécurité et de contribuer à son évolution.

Les plus récentes innovations en IA de Google démontrent son engagement à offrir aux développeurs des outils toujours plus puissants et flexibles, adaptés à divers besoins et budgets, allant de la génération d’images de haute qualité au traitement efficace du texte et à l’assistance IA en ligne de commande.

Source:

Latest News