Google a rendu son plus récent modèle d’IA, Gemini 2.5 Flash, accessible de façon générale aux développeurs et aux entreprises, marquant une avancée significative dans les capacités de codage assisté par l’IA.
Le nouveau modèle, qui était en préversion depuis avril, apporte des améliorations substantielles sur plusieurs plans. Selon Google DeepMind, Gemini 2.5 Flash a été optimisé pour le raisonnement, la multimodalité, la génération de code et le traitement de contextes étendus, tout en devenant encore plus efficace grâce à une réduction de 20 à 30 % du nombre de jetons utilisés lors des évaluations.
Ce qui distingue Gemini 2.5 Flash, c’est son statut de premier modèle Flash de Google doté de capacités de réflexion. Cela permet au modèle de raisonner à travers des problèmes avant de répondre, les développeurs ayant la possibilité de contrôler le « budget de réflexion » afin d’équilibrer la qualité, le coût et la latence. Même lorsque la réflexion est désactivée, le modèle conserve la rapidité des versions précédentes tout en améliorant les performances.
Les capacités de codage sont particulièrement remarquables. Alors que Gemini 2.5 Pro domine les bancs d’essai de codage avec un impressionnant score ELO de 1415 sur le classement WebDev Arena, 2.5 Flash a également démontré des progrès notables en génération de code et en raisonnement complexe. Cela en fait un outil précieux pour les développeurs œuvrant sur des applications web ou des tâches de traitement de données.
Au-delà du codage, le modèle introduit plusieurs nouvelles fonctionnalités, dont une sortie audio native pour des expériences conversationnelles plus naturelles et des capacités de synthèse vocale prenant en charge plusieurs locuteurs dans 24 langues. Google intègre également les fonctionnalités d’utilisation d’ordinateur du Project Mariner à l’API Gemini et à Vertex AI, permettant au modèle d’interagir avec des interfaces informatiques.
Cette sortie s’inscrit dans la stratégie plus large de Google visant à élargir la famille Gemini 2.5, qui comprend désormais les variantes Flash, Pro et la toute nouvelle Flash-Lite. Les trois modèles offrent une fenêtre de contexte d’un million de jetons et des capacités d’entrée multimodale, mais sont optimisés pour différents cas d’utilisation et exigences d’efficacité.
Les développeurs peuvent accéder à Gemini 2.5 Flash via Google AI Studio, tandis que les entreprises peuvent le déployer via Vertex AI. Le modèle est également accessible à tous dans l’application Gemini, rendant les capacités avancées de l’IA plus accessibles dans l’écosystème Google.