Anthropic a dévoilé, le 22 mai 2025, ses modèles d’IA de nouvelle génération : Claude Opus 4 et Claude Sonnet 4, dotés de capacités qui repoussent les limites de ce que les systèmes d’IA peuvent accomplir sans intervention humaine.
Claude Opus 4, que la société décrit comme « le meilleur modèle de programmation au monde », a obtenu un score révolutionnaire de 72,5 % sur SWE-bench, un rigoureux banc d’essai en génie logiciel qui mesure la performance sur des tâches de programmation réelles. Lors de tests menés chez Rakuten, le modèle a démontré une endurance remarquable en travaillant de façon autonome sur un projet open source complexe pendant près de sept heures — un bond significatif par rapport à la capacité d’attention de quelques minutes des modèles d’IA précédents.
Claude Sonnet 4, conçu comme une alternative plus efficace à Opus 4, offre des capacités supérieures de programmation et de raisonnement par rapport à son prédécesseur, Claude Sonnet 3.7. Fait surprenant, il a même obtenu un score supérieur sur le SWE-bench avec 72,7 %, surpassant des concurrents comme Codex-1 d’OpenAI (72,1 %) et Gemini 2.5 Pro de Google (63,2 %).
Les deux modèles intègrent des capacités de raisonnement hybride, leur permettant d’alterner entre des réponses quasi instantanées et des réflexions prolongées pour un raisonnement plus approfondi. Ils peuvent utiliser des outils comme la recherche web durant leur processus de réflexion et, lorsqu’ils ont accès à des fichiers locaux, extraire et sauvegarder les informations clés afin de maintenir la continuité et d’enrichir leur base de connaissances au fil du temps.
Ces nouveaux modèles représentent un changement de paradigme dans la fonctionnalité de l’IA, passant de simples chatbots à des agents de travail autonomes capables de gérer des flux de travail complexes et multi-étapes sur des milliers d’étapes. Cette évolution permet à l’IA de s’attaquer à des projets d’une journée complète, de la conception à la réalisation, tout en maintenant le contexte tout au long du processus.
Claude Sonnet 4 est offert à tous les utilisateurs de Claude, y compris ceux du forfait gratuit, tandis que Claude Opus 4 est réservé aux abonnés des forfaits Pro, Max, Équipe et Entreprise. Les deux modèles sont également accessibles via l’API d’Anthropic, Amazon Bedrock et Vertex AI de Google Cloud, avec une tarification identique aux modèles précédents : Opus 4 à 15 $/75 $ par million de jetons (entrée/sortie) et Sonnet 4 à 3 $/15 $.