Anthropic a officiellement lancé ses modèles d’IA de nouvelle génération, Claude Opus 4 et Claude Sonnet 4, marquant une avancée majeure dans les capacités de l’intelligence artificielle en date du 22 mai 2025.
Claude Opus 4, présenté comme le modèle phare d’Anthropic, a été qualifié par l’entreprise de « meilleur modèle de programmation au monde ». Il domine le classement SWE-bench avec un score de 72,5 % et Terminal-bench avec 43,2 %, offrant des performances soutenues sur des tâches de longue durée nécessitant un effort concentré sur des milliers d’étapes. Le modèle peut travailler sans interruption pendant plusieurs heures, surpassant largement les anciens modèles Sonnet et élargissant le champ des possibles pour les agents IA.
Claude Sonnet 4 représente une amélioration significative par rapport à Claude Sonnet 3.7, offrant de meilleures capacités de programmation et de raisonnement tout en répondant plus précisément aux instructions. Fait intéressant, il atteint 72,7 % sur SWE-bench et, avec un calcul parallèle lors des tests, atteint une précision de 80,2 %—offrant ainsi de meilleures performances en programmation que le modèle Opus 4, pourtant plus volumineux. Anthropic le décrit comme un équilibre entre « performance et efficacité pour des cas d’utilisation internes et externes, avec une meilleure contrôlabilité pour un plus grand contrôle sur les implémentations ».
Les deux modèles introduisent de puissantes nouvelles capacités, notamment la réflexion prolongée avec utilisation d’outils, permettant à Claude d’alterner entre raisonnement et utilisation d’outils pour améliorer ses réponses. Ils peuvent utiliser des outils en parallèle, suivre les instructions avec plus de précision et—lorsque les développeurs leur donnent accès à des fichiers locaux—démontrer des capacités de mémoire nettement améliorées, extrayant et sauvegardant les faits clés afin de maintenir la continuité et de bâtir un savoir tacite au fil du temps.
Les modèles peuvent extraire et sauvegarder des faits dans leur « mémoire » pour traiter les tâches de façon plus fiable, construisant ce qu’Anthropic décrit comme un « savoir tacite » au fil du temps. Opus 4 et Sonnet 4 sont tous deux des modèles « hybrides » capables de fournir des réponses quasi instantanées ou d’engager une réflexion approfondie pour un raisonnement plus poussé. En mode raisonnement, ils peuvent prendre plus de temps pour envisager différentes solutions avant de répondre, présentant un résumé convivial de leur processus de réflexion.
Les deux modèles sont disponibles via l’API d’Anthropic, Amazon Bedrock et Vertex AI de Google Cloud. Les prix restent identiques à ceux des versions précédentes : Opus 4 à 15 $/75 $ par million de jetons (entrée/sortie) et Sonnet 4 à 3 $/15 $. Pour les utilisateurs individuels, Anthropic propose des forfaits d’abonnement échelonnés. Le forfait gratuit donne accès à Claude Sonnet 4 avec des limites d’utilisation quotidiennes, tandis que le forfait Pro (20 $/mois ou 200 $/an) offre environ cinq fois plus d’utilisation que le forfait gratuit, l’accès à Claude 4 Sonnet et Claude 4 Opus via un sélecteur de modèle, ainsi qu’un accès prioritaire lors des périodes de forte affluence.
Le lancement de Claude 4 marque une nouvelle ère pour les grands modèles de langage. Ces offres représentent un bond en avant pour les applications en entreprise, en recherche et en création, avec une fenêtre de contexte de 200 000 jetons, des références de pointe en programmation et en raisonnement, et un cadre de sécurité robuste conçu pour des scénarios complexes, critiques et en constante évolution du monde réel.