Anthropic præsenterede sine næste generations AI-modeller den 22. maj 2025 og introducerede Claude Opus 4 og Claude Sonnet 4 med evner, der udvider grænserne for, hvad AI-systemer kan opnå uden menneskelig indgriben.
Claude Opus 4, som Anthropic beskriver som "verdens bedste kodningsmodel", opnåede en banebrydende score på 72,5 % på SWE-bench, en krævende softwareingeniør-benchmark, der måler præstation på virkelige kodningsopgaver. Under test hos Rakuten viste modellen bemærkelsesværdig udholdenhed ved at arbejde autonomt på et komplekst open source-projekt i næsten syv timer – et markant spring ud over de minutlange opmærksomhedsspænd fra tidligere AI-modeller.
Claude Sonnet 4, der er designet som et mere effektivt alternativ til Opus 4, leverer overlegne kodnings- og ræsonnementsevner sammenlignet med sin forgænger, Claude Sonnet 3.7. Overraskende nok opnåede den endda en højere score på SWE-bench med 72,7 %, hvilket overgik konkurrenter som OpenAI's Codex-1 (72,1 %) og Googles Gemini 2.5 Pro (63,2 %).
Begge modeller har hybride ræsonnementsevner, som gør det muligt at skifte mellem næsten øjeblikkelige svar og længerevarende tænkning for dybere analyse. De kan bruge værktøjer som websøgning under deres tænkning og – når de får adgang til lokale filer – kan de udtrække og gemme nøgledetaljer for at bevare kontinuitet og opbygge viden over tid.
De nye modeller repræsenterer et paradigmeskifte i AI-funktionalitet og forvandler sig fra simple chatbots til autonome arbejdsagenter, der kan håndtere komplekse, flertrins arbejdsgange over tusindvis af trin. Denne udvikling gør det muligt for AI at påtage sig dagslange projekter fra start til slut, mens den bevarer kontekst hele vejen igennem.
Claude Sonnet 4 er tilgængelig for alle Claude-brugere, inklusive dem på gratisniveauet, mens Claude Opus 4 kun er tilgængelig for Pro-, Max-, Team- og Enterprise-abonnenter. Begge modeller kan også tilgås via Anthropics API, Amazon Bedrock og Google Clouds Vertex AI, med priser svarende til tidligere modeller: Opus 4 til $15/$75 pr. million tokens (input/output) og Sonnet 4 til $3/$15.