Anthropic har nått en betydande milstolpe inom artificiell intelligens med sin modell Claude 4 Opus, som nu visar kodningsförmågor i nivå med erfarna mänskliga programmerare.
Claude 4 Opus, som lanserades i maj 2025, har etablerat sig som den ledande AI-modellen för programmering och har uppnått rekordhöga 72,5 % på SWE-bench – ett rigoröst mjukvaruingenjörstest som mäter prestanda på verkliga GitHub-problem. Detta är en avsevärd förbättring jämfört med OpenAIs GPT-4.1, som nådde 54,6 % på samma test.
Det som särskiljer Claude 4 Opus är dess unika förmåga att bibehålla fokus och kontext under långa tidsperioder. Vid tester hos Rakuten arbetade modellen självständigt med ett komplext open source-refaktoreringsprojekt i nästan sju timmar utan att tappa koncentration eller sammanhang – en förmåga som förvandlar AI från ett snabbt svarande verktyg till en verklig samarbetspartner för heldagsprojekt.
Med ett kontextfönster på 200 000 token kan Claude 4 Opus bearbeta hela företagskodbaser, hantera komplexa ändringar över flera filer och anpassa sig till specifika kodningsstilar, samtidigt som den levererar exceptionell kvalitet vid omfattande genererings- och refaktoreringsuppgifter. Enligt feedback från utvecklare uppvisar modellen färdigheter motsvarande en programmerare med PhD-nivå och flera års erfarenhet.
Detta framsteg innebär mer än bara teknisk utveckling – det signalerar en grundläggande förändring i hur organisationer närmar sig kunskapsarbete. Uppgifter som tidigare krävde kontinuerlig mänsklig uppmärksamhet kan nu överlåtas till AI-system som bibehåller fokus och kontext i timmar eller till och med dagar. De ekonomiska konsekvenserna är betydande, särskilt då branschanalytiker förutspår att 2025 blir året då enklare operativa kundtjänstroller inom hälso-, finans- och juridiksektorn börjar se omfattande bortfall av jobb.
Utöver kodning utmärker sig Claude 4 Opus även inom forskning, skrivande och vetenskapliga upptäckter. Modellen finns tillgänglig via flera kanaler, däribland Anthropics API, Amazon Bedrock och Google Clouds Vertex AI, med priser från 15 dollar per miljon inmatningstoken och 75 dollar per miljon utmatningstoken.
I takt med att AI-system som Claude 4 Opus fortsätter att utvecklas är utmaningen för organisationer inte längre om AI kan matcha mänskliga färdigheter, utan att anpassa sig till en framtid där våra mest produktiva samarbetspartners allt oftare kan vara digitala snarare än mänskliga.