Anthropic oficjalnie zaprezentował swoje najnowsze modele sztucznej inteligencji: Claude Opus 4 oraz Claude Sonnet 4, co stanowi znaczący krok naprzód w rozwoju AI na dzień 22 maja 2025 roku.
Claude Opus 4, określany przez Anthropic jako flagowy model, został nazwany przez firmę „najlepszym modelem kodującym na świecie”. Model ten osiąga najwyższe wyniki w branżowych testach: 72,5% na SWE-bench oraz 43,2% na Terminal-bench, zapewniając stabilną wydajność podczas długotrwałych zadań wymagających skupienia przez tysiące kroków. Claude Opus 4 może pracować nieprzerwanie przez kilka godzin, wyraźnie przewyższając wcześniejsze modele Sonnet i rozszerzając zakres możliwości agentów AI.
Claude Sonnet 4 to znaczące ulepszenie względem Claude Sonnet 3.7, oferujące lepsze kodowanie i rozumowanie oraz bardziej precyzyjne reagowanie na polecenia. Co ciekawe, osiąga on 72,7% na SWE-bench, a przy równoległym wykorzystaniu mocy obliczeniowej podczas testów – aż 80,2% skuteczności, co daje mu lepsze wyniki w kodowaniu niż większy model Opus 4. Anthropic opisuje go jako model łączący „wydajność i efektywność zarówno do zastosowań wewnętrznych, jak i zewnętrznych, z ulepszoną sterowalnością dla większej kontroli nad wdrożeniami”.
Oba modele wprowadzają potężne nowe możliwości, w tym rozszerzone myślenie z wykorzystaniem narzędzi, pozwalając Claude’owi przełączać się między rozumowaniem a użyciem narzędzi w celu ulepszenia odpowiedzi. Mogą korzystać z narzędzi równolegle, precyzyjniej wykonywać polecenia, a po uzyskaniu dostępu do lokalnych plików przez deweloperów – wykazują znacząco ulepszoną pamięć, wyodrębniając i zapisując kluczowe fakty, by utrzymać ciągłość i budować ukrytą wiedzę w czasie.
Modele potrafią wyodrębniać i zapisywać fakty w „pamięci”, by skuteczniej realizować zadania, budując – jak określa to Anthropic – „ukrytą wiedzę” w dłuższej perspektywie. Zarówno Opus 4, jak i Sonnet 4 to modele „hybrydowe”, zdolne do niemal natychmiastowych odpowiedzi oraz pogłębionego rozumowania. Po włączeniu trybu rozumowania mogą poświęcić więcej czasu na rozważenie możliwych rozwiązań przed udzieleniem odpowiedzi, prezentując „przyjazne dla użytkownika” podsumowanie swojego toku myślenia.
Oba modele są dostępne poprzez API Anthropic, Amazon Bedrock oraz Vertex AI w Google Cloud. Cennik pozostaje zgodny z wcześniejszymi modelami Opus i Sonnet: Opus 4 kosztuje 15/75 dolarów za milion tokenów (wejście/wyjście), a Sonnet 4 – 3/15 dolarów. Dla użytkowników indywidualnych Anthropic oferuje zróżnicowane plany subskrypcyjne. Plan bezpłatny zapewnia dostęp do Claude Sonnet 4 z dziennymi limitami, natomiast plan Pro (20 dolarów miesięcznie lub 200 dolarów rocznie) oferuje około pięciokrotnie większy limit wykorzystania niż plan darmowy, dostęp do obu modeli Claude 4 Sonnet i Claude 4 Opus przez selektor modelu oraz priorytetowy dostęp w okresach wzmożonego ruchu.
Premiera Claude 4 zwiastuje nową erę dużych modeli językowych. Te rozwiązania stanowią przełom dla przedsiębiorstw, nauki i kreatywnych zastosowań dzięki oknu kontekstowemu o pojemności 200 000 tokenów, najlepszym w klasie wynikom w kodowaniu i rozumowaniu oraz solidnym mechanizmom bezpieczeństwa zaprojektowanym z myślą o złożonych, wymagających i dynamicznych scenariuszach rzeczywistości.