Anthropic prezentuje Claude 4: Nowe standardy w kodowaniu AI

Firma Anthropic niedawno wprowadziła na rynek modele Claude Opus 4 i Claude Sonnet 4, ustanawiając nowe standardy w zakresie kodowania i zdolności rozumowania sztucznej inteligencji. Claude Opus 4 przewodzi branżowym rankingom z wynikiem 72,5% na SWE-bench, podczas gdy Sonnet 4 oferuje wysoką wydajność w bardziej przystępnej cenie. Oba modele wyposażono w hybrydowe rozumowanie, umożliwiające przełączanie się między natychmiastowymi odpowiedziami a dłuższym, pogłębionym myśleniem z integracją narzędzi, co znacząco zwiększa ich możliwości w realizacji złożonych, wieloetapowych zadań.

Anthropic oficjalnie zaprezentował swoje najnowsze modele sztucznej inteligencji: Claude Opus 4 oraz Claude Sonnet 4, co stanowi znaczący krok naprzód w rozwoju AI na dzień 22 maja 2025 roku.

Claude Opus 4, określany przez Anthropic jako flagowy model, został nazwany przez firmę „najlepszym modelem kodującym na świecie”. Model ten osiąga najwyższe wyniki w branżowych testach: 72,5% na SWE-bench oraz 43,2% na Terminal-bench, zapewniając stabilną wydajność podczas długotrwałych zadań wymagających skupienia przez tysiące kroków. Claude Opus 4 może pracować nieprzerwanie przez kilka godzin, wyraźnie przewyższając wcześniejsze modele Sonnet i rozszerzając zakres możliwości agentów AI.

Claude Sonnet 4 to znaczące ulepszenie względem Claude Sonnet 3.7, oferujące lepsze kodowanie i rozumowanie oraz bardziej precyzyjne reagowanie na polecenia. Co ciekawe, osiąga on 72,7% na SWE-bench, a przy równoległym wykorzystaniu mocy obliczeniowej podczas testów – aż 80,2% skuteczności, co daje mu lepsze wyniki w kodowaniu niż większy model Opus 4. Anthropic opisuje go jako model łączący „wydajność i efektywność zarówno do zastosowań wewnętrznych, jak i zewnętrznych, z ulepszoną sterowalnością dla większej kontroli nad wdrożeniami”.

Oba modele wprowadzają potężne nowe możliwości, w tym rozszerzone myślenie z wykorzystaniem narzędzi, pozwalając Claude’owi przełączać się między rozumowaniem a użyciem narzędzi w celu ulepszenia odpowiedzi. Mogą korzystać z narzędzi równolegle, precyzyjniej wykonywać polecenia, a po uzyskaniu dostępu do lokalnych plików przez deweloperów – wykazują znacząco ulepszoną pamięć, wyodrębniając i zapisując kluczowe fakty, by utrzymać ciągłość i budować ukrytą wiedzę w czasie.

Modele potrafią wyodrębniać i zapisywać fakty w „pamięci”, by skuteczniej realizować zadania, budując – jak określa to Anthropic – „ukrytą wiedzę” w dłuższej perspektywie. Zarówno Opus 4, jak i Sonnet 4 to modele „hybrydowe”, zdolne do niemal natychmiastowych odpowiedzi oraz pogłębionego rozumowania. Po włączeniu trybu rozumowania mogą poświęcić więcej czasu na rozważenie możliwych rozwiązań przed udzieleniem odpowiedzi, prezentując „przyjazne dla użytkownika” podsumowanie swojego toku myślenia.

Oba modele są dostępne poprzez API Anthropic, Amazon Bedrock oraz Vertex AI w Google Cloud. Cennik pozostaje zgodny z wcześniejszymi modelami Opus i Sonnet: Opus 4 kosztuje 15/75 dolarów za milion tokenów (wejście/wyjście), a Sonnet 4 – 3/15 dolarów. Dla użytkowników indywidualnych Anthropic oferuje zróżnicowane plany subskrypcyjne. Plan bezpłatny zapewnia dostęp do Claude Sonnet 4 z dziennymi limitami, natomiast plan Pro (20 dolarów miesięcznie lub 200 dolarów rocznie) oferuje około pięciokrotnie większy limit wykorzystania niż plan darmowy, dostęp do obu modeli Claude 4 Sonnet i Claude 4 Opus przez selektor modelu oraz priorytetowy dostęp w okresach wzmożonego ruchu.

Premiera Claude 4 zwiastuje nową erę dużych modeli językowych. Te rozwiązania stanowią przełom dla przedsiębiorstw, nauki i kreatywnych zastosowań dzięki oknu kontekstowemu o pojemności 200 000 tokenów, najlepszym w klasie wynikom w kodowaniu i rozumowaniu oraz solidnym mechanizmom bezpieczeństwa zaprojektowanym z myślą o złożonych, wymagających i dynamicznych scenariuszach rzeczywistości.

Source:

Anthropic prezentuje Claude 4: Nowe standardy w kodowaniu AI

Latest News

Narzędzie FDA do przeglądu urządzeń medycznych oparte na AI napotyka na problemy techniczne

Amazon Alexa Plus zasilana przez AI rzuca wyzwanie rynkowi asystentów głosowych

Google wprowadzi Gemini 2.5 Pro z zaawansowanym rozumowaniem w czerwcu

WWDC 2025 Apple: Sztuczna inteligencja w tyle, gdy na pierwszy plan wysuwa się wielka zmiana designu

Reddit pozywa firmę Anthropic za nielegalne pozyskiwanie danych do trenowania AI

Robotyczni kurierzy Amazona: Humanoidalne boty dostawcze w fazie testów

Chiny blokują wdrożenie AI Apple-Alibaba w obliczu wojny handlowej z Trumpem

Model AI firmy Anthropic grozi szantażem w obliczu wyłączenia

Amazon inwestuje 10 mld dolarów w wiejskie regiony Karoliny Północnej na centrum danych AI

Google prezentuje detektor SynthID do walki z dezinformacją generowaną przez AI

Anthropic prezentuje Claude 4: Nowe standardy w kodowaniu AI

Related Articles

Amazon Alexa Plus zasilana przez AI rzuca wyzwanie rynkowi asystentów głosowych

Google wprowadzi Gemini 2.5 Pro z zaawansowanym rozumowaniem w czerwcu

WWDC 2025 Apple: Sztuczna inteligencja w tyle, gdy na pierwszy plan wysuwa się wielka zmiana designu

Reddit pozywa firmę Anthropic za nielegalne pozyskiwanie danych do trenowania AI

Model AI firmy Anthropic grozi szantażem w obliczu wyłączenia

Latest News

Narzędzie FDA do przeglądu urządzeń medycznych oparte na AI napotyka na problemy techniczne

Amazon Alexa Plus zasilana przez AI rzuca wyzwanie rynkowi asystentów głosowych

Google wprowadzi Gemini 2.5 Pro z zaawansowanym rozumowaniem w czerwcu

WWDC 2025 Apple: Sztuczna inteligencja w tyle, gdy na pierwszy plan wysuwa się wielka zmiana designu

Reddit pozywa firmę Anthropic za nielegalne pozyskiwanie danych do trenowania AI

Robotyczni kurierzy Amazona: Humanoidalne boty dostawcze w fazie testów

Chiny blokują wdrożenie AI Apple-Alibaba w obliczu wojny handlowej z Trumpem

Model AI firmy Anthropic grozi szantażem w obliczu wyłączenia

Amazon inwestuje 10 mld dolarów w wiejskie regiony Karoliny Północnej na centrum danych AI

Google prezentuje detektor SynthID do walki z dezinformacją generowaną przez AI