Anthropic a dévoilé le 22 mai 2025 ses modèles d’IA de nouvelle génération, Claude Opus 4 et Claude Sonnet 4, dotés de capacités qui repoussent les limites de ce que les systèmes d’IA peuvent accomplir sans intervention humaine.
Claude Opus 4, que la société présente comme « le meilleur modèle de codage au monde », a obtenu un score révolutionnaire de 72,5 % sur le SWE-bench, un benchmark exigeant d’ingénierie logicielle qui évalue les performances sur des tâches de codage réelles. Lors de tests menés chez Rakuten, le modèle a démontré une endurance remarquable en travaillant de façon autonome sur un projet open source complexe pendant près de sept heures – un bond significatif par rapport à la capacité d’attention de quelques minutes des précédents modèles d’IA.
Claude Sonnet 4, conçu comme une alternative plus efficiente à Opus 4, offre des capacités de codage et de raisonnement supérieures à son prédécesseur, Claude Sonnet 3.7. De manière surprenante, il a même obtenu un score supérieur sur le SWE-bench avec 72,7 %, surpassant des concurrents tels que Codex-1 d’OpenAI (72,1 %) et Gemini 2.5 Pro de Google (63,2 %).
Les deux modèles intègrent des capacités de raisonnement hybride, leur permettant d’alterner entre des réponses quasi-instantanées et des réflexions prolongées pour un raisonnement plus approfondi. Ils peuvent utiliser des outils comme la recherche web pendant leur processus de réflexion et – lorsqu’ils ont accès à des fichiers locaux – extraire et sauvegarder des informations clés afin de maintenir la continuité et d’enrichir leurs connaissances au fil du temps.
Ces nouveaux modèles représentent un changement de paradigme dans la fonctionnalité de l’IA, passant de simples chatbots à de véritables agents de travail autonomes capables de gérer des flux de travail complexes et multi-étapes sur des milliers d’actions. Cette évolution permet à l’IA de mener à bien des projets d’une journée entière, de la conception à la réalisation, tout en conservant le contexte tout au long du processus.
Claude Sonnet 4 est disponible pour tous les utilisateurs de Claude, y compris ceux de la formule gratuite, tandis que Claude Opus 4 est réservé aux abonnés des offres Pro, Max, Team et Enterprise. Les deux modèles sont également accessibles via l’API d’Anthropic, Amazon Bedrock et Vertex AI de Google Cloud, avec une tarification inchangée par rapport aux modèles précédents : Opus 4 à 15 $/75 $ par million de jetons (entrée/sortie) et Sonnet 4 à 3 $/15 $.