menu
close

Google dévoile Gemini 2.5 Flash avec des capacités de raisonnement avancées

Google a lancé Gemini 2.5 Flash en mode aperçu, apportant des améliorations majeures à son modèle d’IA rapide et économique. Cette nouvelle version introduit des capacités de raisonnement hybride qui permettent aux développeurs de contrôler le processus de réflexion du modèle tout en maintenant la rapidité et l’efficacité. L’aperçu est maintenant disponible dans Google AI Studio, Vertex AI et l’application Gemini, avec un lancement général prévu pour le début juin 2025.
Google dévoile Gemini 2.5 Flash avec des capacités de raisonnement avancées

Google a lancé une version en aperçu de Gemini 2.5 Flash, la toute dernière itération de son modèle d’IA efficace conçu pour équilibrer performance, rapidité et rentabilité.

S’appuyant sur les bases de Gemini 2.0 Flash, le nouveau modèle 2.5 Flash offre une amélioration majeure des capacités de raisonnement tout en conservant sa réputation d’efficacité. Google le décrit comme « une avancée majeure en matière de raisonnement, tout en continuant de privilégier la rapidité et le coût ».

La caractéristique phare de Gemini 2.5 Flash est son système de raisonnement hybride. Il s’agit du « premier modèle de raisonnement entièrement hybride de Google, permettant aux développeurs d’activer ou de désactiver la réflexion, et de définir des budgets de réflexion pour optimiser l’équilibre entre qualité, coût et latence ». Cette approche novatrice donne aux développeurs un contrôle sans précédent sur la façon dont le modèle traite les tâches complexes.

Concrètement, cela signifie que les développeurs peuvent spécifier un « budget de réflexion » qui contrôle le niveau de raisonnement effectué par le modèle. Ils peuvent ajuster « le nombre de jetons qu’un modèle peut générer pendant la réflexion » de 0 à 24 576 jetons à l’aide d’un curseur dans Google AI Studio et Vertex AI, ou via un paramètre d’API. Lorsque le budget de réflexion est à zéro, le modèle affiche les mêmes coûts et la même latence que Gemini 2.0 Flash.

La tarification reflète cette flexibilité : les jetons d’entrée coûtent 15 cents par million et les jetons de sortie 60 cents par million sans raisonnement. Avec les capacités de réflexion activées, le coût grimpe à 3,50 $ par million de jetons.

Les tests de performance sont impressionnants. Gemini 2.5 Flash « affiche d’excellents résultats sur les Hard Prompts dans LMArena, n’étant devancé que par 2.5 Pro » et « présente des métriques comparables à d’autres modèles de pointe pour une fraction du coût et de la taille », continuant « d’être le modèle avec le meilleur rapport qualité-prix ».

Google décrit 2.5 Flash comme son « modèle de référence le plus efficace, conçu pour la rapidité et le faible coût », en précisant qu’il « s’est amélioré sur des critères clés tels que le raisonnement, la multimodalité, le code et le contexte long, tout en étant encore plus efficace, utilisant 20 à 30 % moins de jetons » lors des évaluations.

Le nouveau modèle est actuellement disponible en mode aperçu via plusieurs canaux. Il est déployé « dans Google AI Studio (développeurs), Vertex AI (entreprises) et l’application Gemini (grand public) ». Selon les annonces de Google lors de l’I/O 2025, la version mise à jour sera « généralement disponible dans Google AI Studio pour les développeurs et dans Vertex AI pour les entreprises dès le début juin », et Gemini 2.5 Pro suivra « peu après ».

Alors que Google continue d’élargir ses capacités en IA, Gemini 2.5 Flash représente une avancée importante pour rendre le raisonnement avancé plus accessible et abordable, tant pour les développeurs que pour les utilisateurs.

Source:

Latest News