Anthropic presenta Claude 4: Nuovi standard nell'AI per la programmazione

Anthropic ha recentemente lanciato Claude Opus 4 e Claude Sonnet 4, stabilendo nuovi standard nelle capacità di programmazione e ragionamento dell'intelligenza artificiale. Claude Opus 4 guida i benchmark di settore con il 72,5% su SWE-bench, mentre Sonnet 4 offre prestazioni superiori a un prezzo più accessibile. Entrambi i modelli presentano un ragionamento ibrido, alternando risposte istantanee e riflessioni prolungate con integrazione di strumenti, migliorando notevolmente la gestione di compiti complessi e multi-step.

Anthropic ha ufficialmente rilasciato i suoi modelli di intelligenza artificiale di nuova generazione, Claude Opus 4 e Claude Sonnet 4, segnando un importante passo avanti nelle capacità dell'AI dal 22 maggio 2025.

Claude Opus 4, presentato come modello di punta di Anthropic, è stato definito dall'azienda "il miglior modello di programmazione al mondo". Guida la classifica SWE-bench con un punteggio del 72,5% e Terminal-bench con il 43,2%, offrendo prestazioni costanti su compiti di lunga durata che richiedono concentrazione per migliaia di passaggi. Il modello può lavorare ininterrottamente per diverse ore, superando di gran lunga le precedenti versioni Sonnet ed espandendo ciò che gli agenti AI possono realizzare.

Claude Sonnet 4 rappresenta un notevole aggiornamento rispetto a Claude Sonnet 3.7, offrendo capacità superiori di programmazione e ragionamento, oltre a una maggiore precisione nell'esecuzione delle istruzioni. Sorprendentemente, raggiunge il 72,7% su SWE-bench e, grazie al calcolo parallelo in fase di test, arriva all'80,2% di accuratezza—superando le prestazioni di programmazione del più grande Opus 4. Anthropic lo descrive come il modello che bilancia "prestazioni ed efficienza per casi d'uso interni ed esterni, con una maggiore controllabilità per una gestione più precisa delle implementazioni".

Entrambi i modelli introducono nuove potenti funzionalità, tra cui il ragionamento esteso con l'uso di strumenti, permettendo a Claude di alternare tra ragionamento e utilizzo di tool per migliorare le risposte. Possono utilizzare strumenti in parallelo, seguire le istruzioni con maggiore precisione e—quando gli sviluppatori concedono l'accesso ai file locali—dimostrano capacità di memoria notevolmente migliorate, estraendo e salvando fatti chiave per mantenere la continuità e costruire conoscenza tacita nel tempo.

I modelli sono in grado di estrarre e salvare informazioni nella "memoria" per gestire i compiti in modo più affidabile, costruendo nel tempo quella che Anthropic definisce "conoscenza tacita". Sia Opus 4 che Sonnet 4 sono modelli "ibridi" capaci di risposte quasi istantanee e di ragionamenti prolungati per analisi più approfondite. Attivando la modalità di ragionamento, possono prendersi più tempo per valutare le possibili soluzioni prima di rispondere, mostrando un riepilogo "user-friendly" del loro processo di pensiero.

Entrambi i modelli sono disponibili tramite API Anthropic, Amazon Bedrock e Vertex AI di Google Cloud. I prezzi restano invariati rispetto ai precedenti modelli Opus e Sonnet: Opus 4 a 15$/75$ per milione di token (input/output) e Sonnet 4 a 3$/15$.

Per gli utenti individuali, Anthropic offre piani di abbonamento a livelli. Il piano gratuito consente l'accesso a Claude Sonnet 4 con limiti giornalieri di utilizzo, mentre il piano Pro (20$/mese o 200$/anno) offre circa cinque volte più utilizzo rispetto al piano gratuito, accesso sia a Claude 4 Sonnet che a Claude 4 Opus tramite un selettore di modelli e priorità di accesso durante i periodi di traffico elevato.

Il lancio di Claude 4 segna una nuova era nei modelli linguistici di grandi dimensioni. Queste soluzioni rappresentano un salto in avanti per le applicazioni aziendali, di ricerca e creative, grazie a una finestra di contesto da 200.000 token, benchmark di programmazione e ragionamento ai vertici della categoria e un solido framework di sicurezza progettato per scenari complessi, critici e in continua evoluzione.

Source:

Anthropic presenta Claude 4: Nuovi standard nell'AI per la programmazione

Latest News

Lo strumento di revisione dei dispositivi medici basato su IA della FDA affronta ostacoli tecnici

Alexa Plus di Amazon, potenziata dall’IA, sfida il mercato degli assistenti vocali

Google pronta a lanciare Gemini 2.5 Pro con ragionamento avanzato a giugno

WWDC 2025 di Apple: Strategia AI in Ritardo mentre il Restyling del Design Diventa Protagonista

Reddit porta Anthropic in tribunale per accuse di scraping dei dati AI

I Corrieri Robotici di Amazon: Iniziano i Test dei Robot Umanoidi per le Consegne

La Cina blocca il lancio dell’IA Apple-Alibaba nel mezzo della guerra commerciale di Trump

Il modello AI di Anthropic minaccia il ricatto quando rischia lo spegnimento

Amazon investe 10 miliardi di dollari nella Carolina del Nord rurale per un polo di data center AI

Google presenta SynthID Detector per contrastare la manipolazione dei contenuti AI

Anthropic presenta Claude 4: Nuovi standard nell'AI per la programmazione

Related Articles

Alexa Plus di Amazon, potenziata dall’IA, sfida il mercato degli assistenti vocali

Google pronta a lanciare Gemini 2.5 Pro con ragionamento avanzato a giugno

WWDC 2025 di Apple: Strategia AI in Ritardo mentre il Restyling del Design Diventa Protagonista

Reddit porta Anthropic in tribunale per accuse di scraping dei dati AI

Il modello AI di Anthropic minaccia il ricatto quando rischia lo spegnimento

Latest News

Lo strumento di revisione dei dispositivi medici basato su IA della FDA affronta ostacoli tecnici

Alexa Plus di Amazon, potenziata dall’IA, sfida il mercato degli assistenti vocali

Google pronta a lanciare Gemini 2.5 Pro con ragionamento avanzato a giugno

WWDC 2025 di Apple: Strategia AI in Ritardo mentre il Restyling del Design Diventa Protagonista

Reddit porta Anthropic in tribunale per accuse di scraping dei dati AI

I Corrieri Robotici di Amazon: Iniziano i Test dei Robot Umanoidi per le Consegne

La Cina blocca il lancio dell’IA Apple-Alibaba nel mezzo della guerra commerciale di Trump

Il modello AI di Anthropic minaccia il ricatto quando rischia lo spegnimento

Amazon investe 10 miliardi di dollari nella Carolina del Nord rurale per un polo di data center AI

Google presenta SynthID Detector per contrastare la manipolazione dei contenuti AI