Anthropic osiągnął znaczący kamień milowy w rozwoju sztucznej inteligencji – model Claude 4 Opus wykazał umiejętności programistyczne dorównujące doświadczonym ludzkim programistom.
Wydany w maju 2025 roku Claude 4 Opus stał się wiodącym modelem AI do programowania, uzyskując rekordowy wynik 72,5% w teście SWE-bench, wymagającym benchmarku inżynierii oprogramowania, który sprawdza wydajność na rzeczywistych problemach z GitHuba. To znacznie lepszy rezultat niż OpenAI GPT-4.1, który na tym samym teście zdobył 54,6%.
Tym, co wyróżnia Claude 4 Opus, jest bezprecedensowa zdolność do utrzymywania koncentracji i kontekstu przez długi czas. Podczas testów w firmie Rakuten model samodzielnie pracował nad złożonym projektem refaktoryzacji open source przez niemal siedem godzin, nie tracąc przy tym spójności ani uwagi – to cecha, która zmienia AI z narzędzia do szybkich odpowiedzi w prawdziwego współpracownika przy projektach trwających cały dzień.
Dzięki oknu kontekstowemu o wielkości 200 000 tokenów Claude 4 Opus potrafi przetwarzać całe korporacyjne bazy kodu, radzić sobie ze złożonymi zmianami w wielu plikach i dostosowywać się do specyficznych stylów programowania, zapewniając wyjątkową jakość przy rozbudowanych projektach generowania i refaktoryzacji. Według opinii deweloperów model prezentuje umiejętności na poziomie programisty komputerowego z doktoratem i kilkuletnim doświadczeniem.
To osiągnięcie to nie tylko postęp technologiczny – to zapowiedź fundamentalnej zmiany w podejściu organizacji do pracy z wiedzą. Zadania wymagające dotąd ciągłej uwagi człowieka mogą być teraz powierzane systemom AI, które utrzymują koncentrację i kontekst przez wiele godzin, a nawet dni. Skutki ekonomiczne są znaczące, zwłaszcza że analitycy branżowi przewidują, iż rok 2025 będzie początkiem masowego wypierania stanowisk operacyjnych na poziomie podstawowym w obsłudze klienta w sektorach zdrowia, finansów i prawa.
Claude 4 Opus wyróżnia się nie tylko w programowaniu – model wykazuje również wysokie kompetencje w zakresie badań, pisania oraz odkryć naukowych. Jest dostępny przez różne kanały, w tym API firmy Anthropic, Amazon Bedrock oraz Vertex AI w Google Cloud, z cenami zaczynającymi się od 15 dolarów za milion tokenów wejściowych i 75 dolarów za milion tokenów wyjściowych.
W miarę jak systemy AI takie jak Claude 4 Opus nadal się rozwijają, wyzwaniem dla organizacji przestaje być pytanie, czy AI dorówna ludzkim umiejętnościom, a staje się konieczność adaptacji do przyszłości, w której najbardziej produktywnymi współpracownikami mogą być coraz częściej cyfrowe, a nie ludzkie byty.