Google dévoile Gemini 2.5 Flash avec des capacités de raisonnement avancées

Google a lancé Gemini 2.5 Flash en mode aperçu, apportant des améliorations majeures à son modèle d’IA rapide et économique. Cette nouvelle version introduit des capacités de raisonnement hybride qui permettent aux développeurs de contrôler le processus de réflexion du modèle tout en maintenant la rapidité et l’efficacité. L’aperçu est maintenant disponible dans Google AI Studio, Vertex AI et l’application Gemini, avec un lancement général prévu pour le début juin 2025.

Google a lancé une version en aperçu de Gemini 2.5 Flash, la toute dernière itération de son modèle d’IA efficace conçu pour équilibrer performance, rapidité et rentabilité.

S’appuyant sur les bases de Gemini 2.0 Flash, le nouveau modèle 2.5 Flash offre une amélioration majeure des capacités de raisonnement tout en conservant sa réputation d’efficacité. Google le décrit comme « une avancée majeure en matière de raisonnement, tout en continuant de privilégier la rapidité et le coût ».

La caractéristique phare de Gemini 2.5 Flash est son système de raisonnement hybride. Il s’agit du « premier modèle de raisonnement entièrement hybride de Google, permettant aux développeurs d’activer ou de désactiver la réflexion, et de définir des budgets de réflexion pour optimiser l’équilibre entre qualité, coût et latence ». Cette approche novatrice donne aux développeurs un contrôle sans précédent sur la façon dont le modèle traite les tâches complexes.

Concrètement, cela signifie que les développeurs peuvent spécifier un « budget de réflexion » qui contrôle le niveau de raisonnement effectué par le modèle. Ils peuvent ajuster « le nombre de jetons qu’un modèle peut générer pendant la réflexion » de 0 à 24 576 jetons à l’aide d’un curseur dans Google AI Studio et Vertex AI, ou via un paramètre d’API. Lorsque le budget de réflexion est à zéro, le modèle affiche les mêmes coûts et la même latence que Gemini 2.0 Flash.

La tarification reflète cette flexibilité : les jetons d’entrée coûtent 15 cents par million et les jetons de sortie 60 cents par million sans raisonnement. Avec les capacités de réflexion activées, le coût grimpe à 3,50 $ par million de jetons.

Les tests de performance sont impressionnants. Gemini 2.5 Flash « affiche d’excellents résultats sur les Hard Prompts dans LMArena, n’étant devancé que par 2.5 Pro » et « présente des métriques comparables à d’autres modèles de pointe pour une fraction du coût et de la taille », continuant « d’être le modèle avec le meilleur rapport qualité-prix ».

Google décrit 2.5 Flash comme son « modèle de référence le plus efficace, conçu pour la rapidité et le faible coût », en précisant qu’il « s’est amélioré sur des critères clés tels que le raisonnement, la multimodalité, le code et le contexte long, tout en étant encore plus efficace, utilisant 20 à 30 % moins de jetons » lors des évaluations.

Le nouveau modèle est actuellement disponible en mode aperçu via plusieurs canaux. Il est déployé « dans Google AI Studio (développeurs), Vertex AI (entreprises) et l’application Gemini (grand public) ». Selon les annonces de Google lors de l’I/O 2025, la version mise à jour sera « généralement disponible dans Google AI Studio pour les développeurs et dans Vertex AI pour les entreprises dès le début juin », et Gemini 2.5 Pro suivra « peu après ».

Alors que Google continue d’élargir ses capacités en IA, Gemini 2.5 Flash représente une avancée importante pour rendre le raisonnement avancé plus accessible et abordable, tant pour les développeurs que pour les utilisateurs.

Source:

Google dévoile Gemini 2.5 Flash avec des capacités de raisonnement avancées

Latest News

L’IA Doubao de ByteDance offre désormais une assistance vidéo en temps réel

OnePlus abandonne le curseur d’alerte au profit de la touche Plus propulsée par l’IA

Les géants allemands de la tech s’unissent pour une gigafactory d’IA soutenue par l’UE

Les procureurs américains ont enquêté sur Builder.ai avant l’effondrement de la startup d’IA évaluée à 1,5 G$

Le fonds souverain de 1,8 billion $ de la Norvège rend l’IA incontournable pour son personnel

OpenTools.ai dévoile un centre de nouvelles sur l’IA pour les professionnels de la technologie

Google ouvre le contrôle informatique par IA aux développeurs via Gemini

Google améliore les modèles Gemini avec des résumés transparents de la réflexion

Google dévoile Gemini 2.5 Flash avec des capacités de raisonnement avancées

Related Articles

L’IA Doubao de ByteDance offre désormais une assistance vidéo en temps réel

OpenTools.ai dévoile un centre de nouvelles sur l’IA pour les professionnels de la technologie

Google ouvre le contrôle informatique par IA aux développeurs via Gemini

Google améliore les modèles Gemini avec des résumés transparents de la réflexion

Google étend les contrôles de coûts liés à l’IA à Gemini 2.5 Pro

Latest News

L’IA Doubao de ByteDance offre désormais une assistance vidéo en temps réel

OnePlus abandonne le curseur d’alerte au profit de la touche Plus propulsée par l’IA

Les géants allemands de la tech s’unissent pour une gigafactory d’IA soutenue par l’UE

Les procureurs américains ont enquêté sur Builder.ai avant l’effondrement de la startup d’IA évaluée à 1,5 G$

Le fonds souverain de 1,8 billion $ de la Norvège rend l’IA incontournable pour son personnel

OpenTools.ai dévoile un centre de nouvelles sur l’IA pour les professionnels de la technologie

Google ouvre le contrôle informatique par IA aux développeurs via Gemini

Google améliore les modèles Gemini avec des résumés transparents de la réflexion