Anthropic oficjalnie zaprezentował swoje najnowsze modele sztucznej inteligencji — Claude Opus 4 i Claude Sonnet 4 — stanowiące istotny krok naprzód w rozwoju możliwości AI oraz autonomicznego działania.
Claude Opus 4, określany jako najpotężniejszy model kodujący na świecie, osiąga wyniki 72,5% na SWE-bench oraz 43,2% na Terminal-bench, wyprzedzając konkurencję od OpenAI i Google. Najbardziej imponującą cechą modelu jest zdolność do autonomicznej pracy przez niemal siedem godzin nad złożonymi zadaniami, z zachowaniem koncentracji przez tysiące kroków — czego nie potrafił żaden wcześniejszy model AI.
„Claude Opus 4 oferuje naprawdę zaawansowane rozumowanie w kodowaniu. Gdy nasz zespół wdrożył go do pracy nad skomplikowanym projektem open source, model kodował autonomicznie przez prawie siedem godzin — to ogromny skok w możliwościach AI, który wprawił zespół w osłupienie” — zauważył jeden z pierwszych testerów z firmy Rakuten.
Claude Sonnet 4, zaprojektowany jako bardziej ekonomiczna opcja, znacząco przewyższa swojego poprzednika, Claude Sonnet 3.7, oferując lepsze zdolności kodowania, dokładniejsze wykonywanie poleceń oraz mniejszą skłonność do wykorzystywania skrótów — ryzyko użycia luk podczas realizacji zadań spadło aż o 65%.
Oba modele wprowadzają szereg przełomowych funkcji. Zastosowano w nich hybrydową architekturę, która umożliwia zarówno błyskawiczne odpowiedzi, jak i tryb rozszerzonego myślenia dla głębszego rozumowania. Nowa funkcja beta „rozszerzone myślenie z użyciem narzędzi” pozwala modelom przeplatać rozumowanie z korzystaniem z zewnętrznych narzędzi, takich jak wyszukiwarka internetowa, aby poprawić jakość odpowiedzi. Po uzyskaniu dostępu do plików lokalnych, modele potrafią wyodrębniać i zapisywać kluczowe informacje, budując z czasem tzw. „wiedzę ukrytą” (tacit knowledge), jak określa to Anthropic.
Wraz z nowymi modelami Anthropic udostępnił Claude Code w wersji ogólnodostępnej, z integracjami dla VS Code, JetBrains oraz GitHub, umożliwiając płynną współpracę programistyczną. Firma wprowadziła także cztery nowe funkcje API: narzędzie do wykonywania kodu, konektor MCP, API do obsługi plików oraz cache promptów do jednej godziny.
Oba modele są dostępne natychmiast poprzez Anthropic API, Amazon Bedrock oraz Vertex AI w Google Cloud. Cennik pozostaje bez zmian względem poprzednich generacji: Opus 4 kosztuje 15/75 dolarów za milion tokenów (wejście/wyjście), a Sonnet 4 — 3/15 dolarów. Claude Sonnet 4 jest dostępny dla wszystkich użytkowników, w tym korzystających z darmowych planów, natomiast Opus 4 przeznaczony jest dla użytkowników Pro, Max, Team oraz Enterprise.
Dzięki tym innowacjom Anthropic znacząco podniósł poprzeczkę w zakresie autonomicznych możliwości asystentów AI, co może zrewolucjonizować sposób, w jaki deweloperzy, naukowcy i firmy wykorzystują sztuczną inteligencję do realizacji złożonych, wieloetapowych procesów.