Anthropic a prezentat pe 22 mai 2025 noile sale modele AI de generație următoare, introducând Claude Opus 4 și Claude Sonnet 4, cu capabilități care împing limitele a ceea ce pot realiza sistemele AI fără intervenție umană.
Claude Opus 4, pe care Anthropic îl descrie drept „cel mai bun model de programare din lume”, a obținut un scor revoluționar de 72,5% pe SWE-bench, un benchmark riguros de inginerie software care măsoară performanța pe sarcini reale de programare. În timpul testelor la Rakuten, modelul a demonstrat o rezistență remarcabilă, lucrând autonom la un proiect open-source complex timp de aproape șapte ore – un salt semnificativ față de atenția de doar câteva minute a modelelor AI anterioare.
Claude Sonnet 4, conceput ca o alternativă mai eficientă la Opus 4, oferă capabilități superioare de programare și raționament comparativ cu predecesorul său, Claude Sonnet 3.7. Surprinzător, acesta a obținut chiar un scor mai mare pe SWE-bench, de 72,7%, depășind competitori precum Codex-1 de la OpenAI (72,1%) și Gemini 2.5 Pro de la Google (63,2%).
Ambele modele dispun de capabilități hibride de raționament, permițându-le să alterneze între răspunsuri aproape instantanee și perioade extinse de gândire pentru raționamente mai profunde. Pot folosi instrumente precum căutarea web în timpul procesului de gândire și – atunci când au acces la fișiere locale – pot extrage și salva informații cheie pentru a menține continuitatea și a construi cunoștințe în timp.
Noile modele reprezintă o schimbare de paradigmă în funcționalitatea AI, transformându-se din simple chatbot-uri în agenți autonomi de lucru, capabili să gestioneze fluxuri complexe de lucru, cu mii de pași. Această evoluție permite AI-ului să abordeze proiecte de o zi întreagă, de la concepție la finalizare, menținând contextul pe tot parcursul.
Claude Sonnet 4 este disponibil tuturor utilizatorilor Claude, inclusiv celor cu plan gratuit, în timp ce Claude Opus 4 este accesibil doar abonaților Pro, Max, Team și Enterprise. Ambele modele pot fi accesate și prin API-ul Anthropic, Amazon Bedrock și Vertex AI de la Google Cloud, cu prețuri similare modelelor anterioare: Opus 4 la 15$/75$ per milion de tokeni (input/output) și Sonnet 4 la 3$/15$.