Anthropic ha ufficialmente rilasciato i suoi modelli di intelligenza artificiale di nuova generazione, Claude Opus 4 e Claude Sonnet 4, segnando un importante passo avanti nelle capacità dell'AI dal 22 maggio 2025.
Claude Opus 4, presentato come modello di punta di Anthropic, è stato definito dall'azienda "il miglior modello di programmazione al mondo". Guida la classifica SWE-bench con un punteggio del 72,5% e Terminal-bench con il 43,2%, offrendo prestazioni costanti su compiti di lunga durata che richiedono concentrazione per migliaia di passaggi. Il modello può lavorare ininterrottamente per diverse ore, superando di gran lunga le precedenti versioni Sonnet ed espandendo ciò che gli agenti AI possono realizzare.
Claude Sonnet 4 rappresenta un notevole aggiornamento rispetto a Claude Sonnet 3.7, offrendo capacità superiori di programmazione e ragionamento, oltre a una maggiore precisione nell'esecuzione delle istruzioni. Sorprendentemente, raggiunge il 72,7% su SWE-bench e, grazie al calcolo parallelo in fase di test, arriva all'80,2% di accuratezza—superando le prestazioni di programmazione del più grande Opus 4. Anthropic lo descrive come il modello che bilancia "prestazioni ed efficienza per casi d'uso interni ed esterni, con una maggiore controllabilità per una gestione più precisa delle implementazioni".
Entrambi i modelli introducono nuove potenti funzionalità, tra cui il ragionamento esteso con l'uso di strumenti, permettendo a Claude di alternare tra ragionamento e utilizzo di tool per migliorare le risposte. Possono utilizzare strumenti in parallelo, seguire le istruzioni con maggiore precisione e—quando gli sviluppatori concedono l'accesso ai file locali—dimostrano capacità di memoria notevolmente migliorate, estraendo e salvando fatti chiave per mantenere la continuità e costruire conoscenza tacita nel tempo.
I modelli sono in grado di estrarre e salvare informazioni nella "memoria" per gestire i compiti in modo più affidabile, costruendo nel tempo quella che Anthropic definisce "conoscenza tacita". Sia Opus 4 che Sonnet 4 sono modelli "ibridi" capaci di risposte quasi istantanee e di ragionamenti prolungati per analisi più approfondite. Attivando la modalità di ragionamento, possono prendersi più tempo per valutare le possibili soluzioni prima di rispondere, mostrando un riepilogo "user-friendly" del loro processo di pensiero.
Entrambi i modelli sono disponibili tramite API Anthropic, Amazon Bedrock e Vertex AI di Google Cloud. I prezzi restano invariati rispetto ai precedenti modelli Opus e Sonnet: Opus 4 a 15$/75$ per milione di token (input/output) e Sonnet 4 a 3$/15$.
Per gli utenti individuali, Anthropic offre piani di abbonamento a livelli. Il piano gratuito consente l'accesso a Claude Sonnet 4 con limiti giornalieri di utilizzo, mentre il piano Pro (20$/mese o 200$/anno) offre circa cinque volte più utilizzo rispetto al piano gratuito, accesso sia a Claude 4 Sonnet che a Claude 4 Opus tramite un selettore di modelli e priorità di accesso durante i periodi di traffico elevato.
Il lancio di Claude 4 segna una nuova era nei modelli linguistici di grandi dimensioni. Queste soluzioni rappresentano un salto in avanti per le applicazioni aziendali, di ricerca e creative, grazie a una finestra di contesto da 200.000 token, benchmark di programmazione e ragionamento ai vertici della categoria e un solido framework di sicurezza progettato per scenari complessi, critici e in continua evoluzione.