Anthropic ha raggiunto un traguardo significativo nello sviluppo dell’intelligenza artificiale con il suo modello Claude 4 Opus, che ha dimostrato capacità di programmazione equiparabili a quelle di programmatori umani esperti.
Rilasciato a maggio 2025, Claude 4 Opus si è affermato come il modello AI di riferimento per la programmazione, raggiungendo un punteggio record del 72,5% su SWE-bench, un rigoroso benchmark di ingegneria del software che valuta le prestazioni su problemi reali di GitHub. Questo risultato supera nettamente GPT-4.1 di OpenAI, che ha ottenuto il 54,6% nello stesso test.
Ciò che distingue Claude 4 Opus è la sua capacità senza precedenti di mantenere concentrazione e contesto per lunghi periodi. Durante i test presso Rakuten, il modello ha lavorato in autonomia su un complesso progetto open source di refactoring per quasi sette ore senza perdere coerenza o attenzione—una caratteristica che trasforma l’AI da semplice strumento di risposta rapida a vero collaboratore per progetti di lunga durata.
Con una finestra di contesto di 200.000 token, Claude 4 Opus può analizzare interi codebase aziendali, gestire modifiche complesse su più file e adattarsi a stili di programmazione specifici, garantendo una qualità eccezionale per progetti di generazione e refactoring su larga scala. Secondo il feedback degli sviluppatori, il modello dimostra competenze equivalenti a quelle di un programmatore informatico con dottorato e diversi anni di esperienza.
Questo progresso rappresenta molto più di un semplice avanzamento tecnico: segna un cambiamento fondamentale nell’approccio delle organizzazioni al lavoro della conoscenza. Attività che un tempo richiedevano attenzione umana continua possono ora essere delegate a sistemi AI in grado di mantenere concentrazione e contesto per ore o addirittura giorni. Le implicazioni economiche sono significative, soprattutto perché gli analisti del settore prevedono che il 2025 sarà l’anno in cui i ruoli operativi entry-level nel customer service di sanità, finanza e diritto inizieranno a subire una sostanziale sostituzione da parte dell’automazione.
Sebbene Claude 4 Opus eccella nella programmazione, mostra anche solide capacità in ricerca, scrittura e scoperta scientifica. Il modello è disponibile tramite diversi canali, tra cui l’API di Anthropic, Amazon Bedrock e Vertex AI di Google Cloud, con prezzi a partire da 15 dollari per milione di token in input e 75 dollari per milione di token in output.
Man mano che sistemi AI come Claude 4 Opus continuano a evolversi, la sfida per le organizzazioni non è più chiedersi se l’AI possa eguagliare le competenze umane, ma adattarsi a un futuro in cui i nostri collaboratori più produttivi potrebbero essere sempre più digitali anziché umani.