Anthropic zaprezentował 22 maja 2025 roku swoje najnowsze modele AI: Claude Opus 4 oraz Claude Sonnet 4, które przesuwają granice możliwości systemów sztucznej inteligencji działających bez udziału człowieka.
Claude Opus 4, określany przez Anthropic jako „najlepszy na świecie model do programowania”, osiągnął przełomowy wynik 72,5% w teście SWE-bench – wymagającym benchmarku inżynierii oprogramowania, mierzącym skuteczność w rzeczywistych zadaniach programistycznych. Podczas testów w firmie Rakuten model wykazał się niezwykłą wytrzymałością, pracując autonomicznie nad złożonym projektem open source przez niemal siedem godzin – co stanowi ogromny postęp w porównaniu do kilkuminutowej koncentracji wcześniejszych modeli AI.
Claude Sonnet 4, zaprojektowany jako bardziej wydajna alternatywa dla Opus 4, oferuje lepsze możliwości programowania i rozumowania niż jego poprzednik, Claude Sonnet 3.7. Co zaskakujące, uzyskał jeszcze wyższy wynik w teście SWE-bench – 72,7%, wyprzedzając konkurentów takich jak Codex-1 od OpenAI (72,1%) oraz Gemini 2.5 Pro od Google (63,2%).
Oba modele wyposażono w hybrydowe możliwości rozumowania, pozwalające przełączać się między błyskawicznymi odpowiedziami a dłuższym, pogłębionym myśleniem. Potrafią korzystać z narzędzi takich jak wyszukiwarka internetowa podczas procesu rozumowania, a po uzyskaniu dostępu do lokalnych plików – wyodrębniać i zapisywać kluczowe informacje, by zachować ciągłość i budować wiedzę w czasie.
Nowe modele stanowią zmianę paradygmatu w funkcjonalności AI – od prostych chatbotów do autonomicznych agentów pracy, zdolnych do realizacji złożonych, wieloetapowych zadań obejmujących tysiące kroków. Ta ewolucja pozwala AI podejmować się projektów trwających cały dzień – od koncepcji po realizację – przy zachowaniu pełnego kontekstu.
Claude Sonnet 4 jest dostępny dla wszystkich użytkowników Claude, także w wersji bezpłatnej, natomiast Claude Opus 4 mogą używać wyłącznie subskrybenci planów Pro, Max, Team oraz Enterprise. Oba modele są także dostępne przez API Anthropic, Amazon Bedrock oraz Vertex AI w Google Cloud, przy zachowaniu dotychczasowych cen: Opus 4 kosztuje 15/75 USD za milion tokenów (wejście/wyjście), a Sonnet 4 – 3/15 USD.