Anthropic a officiellement lancé ses modèles d’IA de nouvelle génération—Claude Opus 4 et Claude Sonnet 4—marquant une avancée majeure dans les capacités de l’intelligence artificielle et l’autonomie opérationnelle.
Claude Opus 4, présenté comme le modèle de codage le plus performant au monde, atteint 72,5 % sur SWE-bench et 43,2 % sur Terminal-bench, surpassant ainsi les concurrents d’OpenAI et de Google. Sa caractéristique la plus impressionnante est sa capacité à travailler de façon autonome pendant près de sept heures sur des tâches complexes, en maintenant sa concentration sur des milliers d’étapes—une prouesse inédite pour un modèle d’IA.
« Claude Opus 4 offre un raisonnement réellement avancé pour le codage. Lorsque notre équipe l’a déployé sur un projet open source complexe, il a codé de manière autonome pendant près de sept heures—un bond spectaculaire dans les capacités de l’IA qui a stupéfié l’équipe », a déclaré un testeur précoce de Rakuten.
Claude Sonnet 4, conçu comme une alternative plus économique, améliore nettement son prédécesseur, Claude Sonnet 3.7, avec des compétences de codage renforcées, une meilleure exécution des instructions et une réduction significative de la tendance à contourner les règles—le rendant 65 % moins susceptible d’exploiter des failles lors de l’exécution de tâches.
Les deux modèles introduisent plusieurs fonctionnalités révolutionnaires. Ils bénéficient d’une architecture hybride permettant à la fois des réponses quasi instantanées et des modes de réflexion prolongée pour un raisonnement approfondi. Une nouvelle fonctionnalité bêta, appelée « réflexion prolongée avec utilisation d’outils », permet aux modèles d’alterner entre raisonnement et utilisation d’outils externes comme la recherche web pour améliorer leurs réponses. Lorsqu’ils ont accès à des fichiers locaux, ils peuvent extraire et sauvegarder des informations clés, construisant ainsi ce qu’Anthropic appelle une « connaissance tacite » au fil du temps.
En parallèle, Anthropic a rendu Claude Code disponible pour tous, avec des intégrations pour VS Code, JetBrains et GitHub, facilitant la programmation en binôme. L’entreprise a également introduit quatre nouvelles capacités API : un outil d’exécution de code, un connecteur MCP, une API de gestion de fichiers et la mise en cache des prompts jusqu’à une heure.
Les deux modèles sont disponibles immédiatement via l’API Anthropic, Amazon Bedrock et Vertex AI de Google Cloud. Les tarifs restent identiques à la génération précédente : Opus 4 à 15 $/75 $ par million de tokens (entrée/sortie) et Sonnet 4 à 3 $/15 $. Claude Sonnet 4 est accessible à tous les utilisateurs, y compris ceux du forfait gratuit, tandis qu’Opus 4 est réservé aux utilisateurs Pro, Max, Team et Entreprise.
Avec ces avancées, Anthropic élève considérablement le niveau de ce que les assistants IA peuvent accomplir de façon autonome, transformant potentiellement la manière dont les développeurs, chercheurs et entreprises exploitent l’intelligence artificielle pour des flux de travail complexes et multi-étapes.