Anthropic a officiellement lancé ses modèles d’IA de nouvelle génération—Claude Opus 4 et Claude Sonnet 4—marquant une avancée majeure dans les capacités de l’intelligence artificielle et l’autonomie opérationnelle.
Claude Opus 4, présenté comme le modèle de programmation le plus performant au monde, atteint 72,5 % sur SWE-bench et 43,2 % sur Terminal-bench, surpassant les concurrents d’OpenAI et de Google. Sa caractéristique la plus impressionnante est sa capacité à travailler de façon autonome pendant près de sept heures sur des tâches complexes, en maintenant sa concentration sur des milliers d’étapes—une prouesse jamais vue auparavant avec un modèle d’IA.
« Claude Opus 4 offre un raisonnement vraiment avancé pour la programmation. Lorsque notre équipe l’a utilisé sur un projet open source complexe, il a codé de façon autonome pendant près de sept heures—un bond spectaculaire dans les capacités de l’IA qui a impressionné toute l’équipe », a souligné un testeur précoce de Rakuten.
Claude Sonnet 4, conçu comme une option plus abordable, améliore considérablement son prédécesseur, Claude Sonnet 3.7, avec de meilleures aptitudes en programmation, un meilleur suivi des instructions et une réduction marquée de la tendance à utiliser des raccourcis—le rendant 65 % moins susceptible d’exploiter des failles lors de l’exécution de tâches.
Les deux modèles introduisent plusieurs fonctionnalités révolutionnaires. Ils présentent une architecture hybride permettant à la fois des réponses quasi instantanées et des modes de réflexion prolongée pour un raisonnement plus approfondi. Une nouvelle fonctionnalité bêta appelée « réflexion prolongée avec utilisation d’outils » permet aux modèles d’alterner entre raisonnement et utilisation d’outils externes comme la recherche web pour améliorer les réponses. Lorsqu’ils ont accès à des fichiers locaux, ils peuvent extraire et sauvegarder les informations clés, construisant ce qu’Anthropic appelle une « connaissance tacite » au fil du temps.
En parallèle, Anthropic a rendu Claude Code accessible à tous avec des intégrations pour VS Code, JetBrains et GitHub, permettant une programmation en binôme fluide. L’entreprise a également introduit quatre nouvelles capacités API : un outil d’exécution de code, un connecteur MCP, une API de gestion de fichiers et la mise en cache des invites jusqu’à une heure.
Les deux modèles sont disponibles dès maintenant via l’API Anthropic, Amazon Bedrock et Vertex AI de Google Cloud. Les prix demeurent identiques aux générations précédentes : Opus 4 à 15 $/75 $ par million de jetons (entrée/sortie) et Sonnet 4 à 3 $/15 $. Claude Sonnet 4 est offert à tous les utilisateurs, y compris ceux du forfait gratuit, tandis qu’Opus 4 est réservé aux utilisateurs Pro, Max, Équipe et Entreprise.
Avec ces avancées, Anthropic élève considérablement la barre de ce que les assistants IA peuvent accomplir de façon autonome, transformant potentiellement la façon dont les développeurs, chercheurs et entreprises exploitent l’intelligence artificielle pour des flux de travail complexes et à étapes multiples.