menu
close

Google élargit son portefeuille d’IA avec Gemini 2.5 et Imagen 4

Google a renforcé son offre en intelligence artificielle en rendant Gemini 2.5 Flash et Pro généralement disponibles, tout en lançant le modèle Flash-Lite, plus économique. L’entreprise a également dévoilé Imagen 4, son modèle texte-vers-image le plus avancé à ce jour, avec des capacités de rendu de texte nettement améliorées. Ces nouveautés s’accompagnent du lancement de Gemini CLI, un outil open source qui intègre l’IA directement dans le terminal des développeurs pour le codage et la résolution de problèmes.
Google élargit son portefeuille d’IA avec Gemini 2.5 et Imagen 4

Google a considérablement élargi son écosystème d’intelligence artificielle avec plusieurs lancements majeurs, se positionnant à l’avant-garde de la technologie générative.

La famille Gemini 2.5 s’est agrandie avec la disponibilité générale des modèles Flash et Pro pour une utilisation en production. « Gemini 2.5 Flash et Pro sont maintenant stables et généralement disponibles, permettant aux développeurs de bâtir des applications de production en toute confiance. Des entreprises comme Spline, Rooms, Snap et SmartBear utilisent déjà ces versions en production depuis plusieurs semaines. » La croissance et la demande pour Gemini 2.5 Pro ont été les plus fortes jamais enregistrées pour un modèle Google, ce qui a poussé la compagnie à stabiliser la version 06-05 tout en maintenant le même prix. Google s’attend à ce que Pro excelle dans les scénarios nécessitant la plus grande intelligence et les capacités les plus avancées, comme le codage et les tâches agentiques.

De plus, Google a lancé Gemini 2.5 Flash-Lite en aperçu, son modèle 2.5 le plus rapide et le plus économique à ce jour. Cette nouvelle version est conçue comme une option abordable pour les tâches à haut volume telles que la classification ou la synthèse à grande échelle, offrant de meilleures performances dans la plupart des évaluations, un temps réduit jusqu’au premier jeton et un débit de jetons par seconde supérieur. Flash-Lite est un modèle de raisonnement qui permet un contrôle dynamique du budget de réflexion via un paramètre d’API. Contrairement aux autres modèles de la famille, la réflexion est désactivée par défaut puisque Flash-Lite est optimisé pour le coût et la rapidité. Malgré cette optimisation, il prend en charge tous les outils natifs, y compris l’ancrage avec la recherche Google, l’exécution de code, le contexte URL et l’appel de fonctions.

Du côté de la génération d’images, Google a lancé Imagen 4, annoncé pour la première fois lors de l’événement I/O 2025 le mois dernier. Google le décrit comme son « meilleur modèle texte-vers-image à ce jour », avec un « rendu de texte nettement amélioré » par rapport aux versions précédentes. Le nouveau modèle offre une clarté remarquable dans les détails fins comme les tissus complexes, les gouttelettes d’eau et la fourrure animale, et excelle tant dans les styles photoréalistes qu’abstraits. Parmi les autres améliorations, on note la prise en charge de la résolution 2K ainsi qu’une meilleure orthographe et typographie. Imagen 4 et une version premium Imagen 4 Ultra sont maintenant offertes en aperçu payant via l’API Gemini, avec des tests gratuits limités dans Google AI Studio. Imagen 4 est tarifé à 0,04 $ par image générée, tandis que la version Ultra coûte 0,06 $ par image.

Pour compléter ces lancements, Gemini CLI fait son entrée comme agent IA open source, apportant la puissance de Gemini directement dans le terminal des développeurs pour le codage, la résolution de problèmes et la gestion de tâches. Les utilisateurs peuvent accéder gratuitement à Gemini 2.5 Pro avec un compte Google personnel, ou utiliser des clés Google AI Studio ou Vertex AI pour un accès élargi. Gemini CLI offre la plus grande allocation d’utilisation de l’industrie avec 60 requêtes modèle par minute et 1 000 requêtes par jour sans frais. Il propose des capacités d’IA puissantes, allant de la compréhension du code et la manipulation de fichiers à l’exécution de commandes et le dépannage dynamique, offrant une mise à niveau fondamentale de l’expérience en ligne de commande et permettant aux utilisateurs d’écrire du code, de déboguer des problèmes et d’optimiser les flux de travail en langage naturel.

Ces nouveautés renforcent collectivement la position de Google dans le paysage concurrentiel de l’IA, offrant aux développeurs et aux utilisateurs des outils plus puissants, efficaces et accessibles pour une large gamme d’applications.

Source:

Latest News