Anthropic a franchi une étape majeure dans le développement de l’intelligence artificielle avec son modèle Claude 4 Opus, qui démontre des aptitudes en programmation équivalentes à celles de programmeurs humains expérimentés.
Lancé en mai 2025, Claude 4 Opus s’est imposé comme le modèle de codage IA le plus performant, atteignant un score record de 72,5 % au SWE-bench, un test rigoureux d’ingénierie logicielle basé sur des problèmes réels issus de GitHub. Ce résultat surpasse largement celui de GPT-4.1 d’OpenAI, qui a obtenu 54,6 % au même test.
Ce qui distingue Claude 4 Opus, c’est sa capacité inédite à maintenir sa concentration et à gérer le contexte sur de longues périodes. Lors de tests menés chez Rakuten, le modèle a travaillé de façon autonome sur un projet complexe de refonte open source pendant près de sept heures sans perdre sa cohérence ni sa concentration—une capacité qui transforme l’IA d’un simple outil de réponse rapide en véritable collaborateur pour des projets de longue haleine.
Grâce à une fenêtre de contexte de 200 000 jetons, Claude 4 Opus peut traiter des bases de code d’entreprise complètes, gérer des modifications complexes touchant plusieurs fichiers et s’adapter à des styles de programmation spécifiques, tout en offrant une qualité exceptionnelle pour des projets de génération et de refonte à grande échelle. Selon les retours des développeurs, le modèle démontre des compétences équivalentes à celles d’un programmeur informatique titulaire d’un doctorat et ayant plusieurs années d’expérience.
Cette avancée représente bien plus qu’un simple progrès technique—elle marque un changement fondamental dans la façon dont les organisations abordent le travail intellectuel. Des tâches qui nécessitaient auparavant une attention humaine continue peuvent désormais être confiées à des systèmes d’IA capables de maintenir le contexte et la concentration pendant des heures, voire des jours. Les répercussions économiques sont majeures, d’autant plus que les analystes de l’industrie prévoient que 2025 sera l’année où les postes opérationnels de service à la clientèle de niveau débutant dans les secteurs de la santé, de la finance et du droit commenceront à subir des pertes d’emplois importantes.
Bien que Claude 4 Opus excelle en programmation, il démontre également de solides compétences en recherche, en rédaction et en découverte scientifique. Le modèle est accessible via plusieurs canaux, dont l’API d’Anthropic, Amazon Bedrock et Vertex AI de Google Cloud, avec des tarifs débutant à 15 $ US par million de jetons en entrée et 75 $ US par million de jetons en sortie.
À mesure que des systèmes d’IA comme Claude 4 Opus continuent d’évoluer, le défi pour les organisations n’est plus de se demander si l’IA peut égaler les compétences humaines, mais plutôt de s’adapter à un avenir où nos collaborateurs les plus productifs seront de plus en plus numériques plutôt qu’humains.