Google dévoile Imagen 4 et élargit la gamme Gemini 2.5

Google a lancé Imagen 4, son modèle texte-image le plus avancé à ce jour, désormais offert en aperçu payant via l’API Gemini et Google AI Studio. Ce lancement coïncide avec la disponibilité générale des modèles Gemini 2.5 Flash et Pro, ainsi que l’introduction de Gemini 2.5 Flash-Lite, le modèle le plus rapide et économique de la famille 2.5. Les développeurs peuvent aussi accéder à Gemini directement dans leur terminal grâce au nouveau Gemini CLI, un outil libre et ouvert.

Google a considérablement élargi ses capacités en intelligence artificielle avec la sortie d’Imagen 4, son modèle de génération d’images à partir de texte le plus avancé, maintenant disponible en aperçu payant via l’API Gemini et Google AI Studio.

Imagen 4 représente une amélioration notable par rapport aux versions précédentes, notamment en ce qui concerne la qualité du rendu du texte dans les images générées. Deux variantes sont proposées : le modèle standard Imagen 4, offert à 0,04 $ par image générée, et Imagen 4 Ultra à 0,06 $ par image, qui offre une précision accrue dans le respect des instructions de l’utilisateur. Les deux modèles intègrent la technologie de filigrane SynthID, invisible à l’œil nu mais permettant d’identifier le contenu généré par l’IA.

Cette sortie s’inscrit dans l’expansion plus large de la famille de modèles Gemini 2.5 de Google. L’entreprise a rendu les modèles Gemini 2.5 Flash et Pro généralement disponibles après des périodes d’essai concluantes, tout en introduisant Gemini 2.5 Flash-Lite en aperçu. Flash-Lite est présenté comme le modèle 2.5 le plus économique et le plus rapide de Google, optimisé pour des tâches à grand volume et sensibles à la latence, telles que la classification, la traduction et le routage intelligent.

Malgré son accent sur l’efficacité, Gemini 2.5 Flash-Lite conserve les principales capacités de la famille 2.5, incluant une fenêtre de contexte d’un million de jetons et la prise en charge d’outils natifs comme l’intégration à la recherche Google et l’exécution de code. Contrairement aux autres modèles de la famille qui activent par défaut les capacités de réflexion, Flash-Lite permet aux développeurs de contrôler le budget de réflexion via des paramètres API, la réflexion étant désactivée par défaut pour optimiser la rapidité et les coûts.

Pour enrichir davantage son offre destinée aux développeurs, Google a lancé Gemini CLI, un agent IA libre et ouvert qui amène Gemini directement dans le terminal. Cet outil permet aux développeurs d’accéder à Gemini 2.5 Pro via une interface en ligne de commande pour la programmation, la résolution de problèmes et la gestion de tâches. Le caractère libre et ouvert de Gemini CLI (sous licence Apache 2.0) permet aux développeurs d’inspecter le code, de vérifier les implications en matière de sécurité et de contribuer à son évolution.

Les plus récentes innovations en IA de Google démontrent son engagement à offrir aux développeurs des outils toujours plus puissants et flexibles, adaptés à divers besoins et budgets, allant de la génération d’images de haute qualité au traitement efficace du texte et à l’assistance IA en ligne de commande.

Source:

Google dévoile Imagen 4 et élargit la gamme Gemini 2.5

Latest News

L’IA devient grand public : 1,8 milliard d’utilisateurs dans le monde, selon un rapport

OpenTools.AI lance un centre de nouvelles sur l’IA pour les professionnels de la technologie

L’UE reporte le guide de conformité à la Loi sur l’IA à la fin de 2025

Les tribunaux de la Géorgie tracent la voie de l’IA dans le système judiciaire

Sutskever prend la tête de SSI après que Meta ait débauché le PDG Gross

Les puces IA ultra-basse consommation d’Ambiq Micro suscitent une IPO au cœur d’une demande explosive sur le marché

Zuckerberg lance Meta Superintelligence Labs dans un virage audacieux vers l’IA

Grok 4 de xAI sera lancé avec des capacités avancées en programmation

Baidu rend publics les modèles ERNIE 4.5 en code source ouvert, défiant les géants de l’IA

Google dévoile Imagen 4 et élargit la gamme Gemini 2.5

Related Articles

Baidu rend publics les modèles ERNIE 4.5 en code source ouvert, défiant les géants de l’IA

Grok 4 de xAI sera lancé avec des capacités avancées en programmation

L’armée de robots d’Amazon franchit le cap du million, une nouvelle IA les rend plus intelligents

Zuckerberg lance Meta Superintelligence Labs dans un virage audacieux vers l’IA

OpenTools.AI lance un centre de nouvelles sur l’IA pour les professionnels de la technologie

Latest News

L’IA devient grand public : 1,8 milliard d’utilisateurs dans le monde, selon un rapport

OpenTools.AI lance un centre de nouvelles sur l’IA pour les professionnels de la technologie

L’UE reporte le guide de conformité à la Loi sur l’IA à la fin de 2025

Les tribunaux de la Géorgie tracent la voie de l’IA dans le système judiciaire

Sutskever prend la tête de SSI après que Meta ait débauché le PDG Gross

Les puces IA ultra-basse consommation d’Ambiq Micro suscitent une IPO au cœur d’une demande explosive sur le marché

Zuckerberg lance Meta Superintelligence Labs dans un virage audacieux vers l’IA

Grok 4 de xAI sera lancé avec des capacités avancées en programmation

Baidu rend publics les modèles ERNIE 4.5 en code source ouvert, défiant les géants de l’IA