Anthropic a franchi une étape majeure dans le développement de l’intelligence artificielle avec son modèle Claude 4 Opus, qui démontre des aptitudes en programmation équivalentes à celles de programmeurs humains expérimentés.
Lancé en mai 2025, Claude 4 Opus s’est imposé comme le modèle de codage IA de référence, atteignant un score record de 72,5 % au SWE-bench, un benchmark exigeant qui évalue les performances sur des problèmes réels issus de GitHub. Ce résultat surpasse largement celui de GPT-4.1 d’OpenAI, qui a obtenu 54,6 % au même test.
Ce qui distingue Claude 4 Opus, c’est sa capacité inédite à maintenir la concentration et le contexte sur de longues périodes. Lors de tests menés chez Rakuten, le modèle a travaillé de manière autonome sur un projet complexe de refonte open source pendant près de sept heures sans perdre en cohérence ni en attention—une faculté qui transforme l’IA d’un simple outil de réponse rapide en un véritable collaborateur pour des projets de longue durée.
Avec une fenêtre de contexte de 200 000 tokens, Claude 4 Opus peut traiter des bases de code d’entreprise entières, gérer des modifications complexes sur plusieurs fichiers et s’adapter à des styles de programmation spécifiques, tout en garantissant une qualité exceptionnelle pour des projets de génération et de refactoring à grande échelle. Selon les retours des développeurs, le modèle affiche des compétences équivalentes à celles d’un informaticien titulaire d’un doctorat en milieu de carrière.
Cette avancée représente bien plus qu’un simple progrès technique : elle marque un changement fondamental dans la manière dont les organisations abordent le travail intellectuel. Des tâches qui nécessitaient auparavant une attention humaine continue peuvent désormais être confiées à des systèmes d’IA capables de maintenir leur concentration et leur contexte pendant des heures, voire des jours. Les conséquences économiques sont majeures, d’autant plus que les analystes du secteur prévoient que 2025 sera l’année où les postes opérationnels débutants dans la relation client des secteurs de la santé, de la finance et du droit commenceront à être massivement remplacés.
Si Claude 4 Opus excelle en programmation, il démontre également de solides compétences en recherche, en rédaction et en découverte scientifique. Le modèle est disponible via plusieurs canaux, dont l’API d’Anthropic, Amazon Bedrock et Vertex AI de Google Cloud, avec des tarifs à partir de 15 $ par million de tokens en entrée et 75 $ par million de tokens en sortie.
À mesure que des systèmes d’IA comme Claude 4 Opus continuent d’évoluer, le défi pour les organisations n’est plus de se demander si l’IA peut égaler les compétences humaines, mais de s’adapter à un avenir où nos collaborateurs les plus productifs seront de plus en plus numériques plutôt qu’humains.