Anthropic je postigao značajnu prekretnicu u razvoju umjetne inteligencije s modelom Claude 4 Opus, koji demonstrira sposobnosti programiranja usporedive s iskusnim ljudskim programerima.
Objavljen u svibnju 2025., Claude 4 Opus nametnuo se kao vodeći AI model za programiranje, ostvarivši rekordnih 72,5% na SWE-bench testu – rigoroznom softversko-inženjerskom benchmarku koji mjeri performanse na stvarnim GitHub zadacima. Time je znatno nadmašio GPT-4.1 tvrtke OpenAI, koji je na istom testu postigao 54,6%.
Ono što Claude 4 Opus izdvaja jest njegova iznimna sposobnost održavanja fokusa i konteksta kroz dulje vremensko razdoblje. Tijekom testiranja u tvrtki Rakuten, model je samostalno radio na složenom open-source projektu refaktoriranja gotovo sedam sati bez gubitka koncentracije ili koherentnosti – sposobnost koja AI pretvara iz alata za brze odgovore u pravog suradnika za cjelodnevne projekte.
S kontekstualnim prozorom od 200.000 tokena, Claude 4 Opus može obraditi čitave poslovne kodne baze, upravljati složenim izmjenama kroz više datoteka i prilagoditi se specifičnim stilovima programiranja, istovremeno isporučujući iznimnu kvalitetu za opsežne zadatke generiranja i refaktoriranja. Prema povratnim informacijama programera, model pokazuje vještine ekvivalentne računalnom programeru s doktoratom i srednjom razinom iskustva.
Ovaj napredak predstavlja više od tehničkog postignuća – označava temeljitu promjenu u načinu na koji organizacije pristupaju intelektualnom radu. Zadaci koji su nekad zahtijevali kontinuiranu ljudsku pažnju sada se mogu povjeriti AI sustavima koji održavaju fokus i kontekst satima ili čak danima. Ekonomske posljedice su značajne, osobito jer analitičari predviđaju da će 2025. biti godina kada će početna operativna radna mjesta u korisničkoj podršci u zdravstvu, financijama i pravu doživjeti značajnu zamjenu ljudske radne snage.
Iako Claude 4 Opus briljira u programiranju, pokazuje i snažne sposobnosti u istraživanju, pisanju i znanstvenom otkrivanju. Model je dostupan putem više kanala, uključujući Anthropicov API, Amazon Bedrock i Google Cloudov Vertex AI, s cijenama od 15 dolara za milijun ulaznih tokena i 75 dolara za milijun izlaznih tokena.
Kako se AI sustavi poput Claude 4 Opus nastavljaju razvijati, izazov za organizacije više nije pitanje može li AI dosegnuti ljudske vještine, već kako se prilagoditi budućnosti u kojoj će naši najproduktivniji suradnici sve češće biti digitalni, a ne ljudski.