Společnost Anthropic oficiálně představila své nové generace AI modelů, Claude Opus 4 a Claude Sonnet 4, což znamená významný posun v možnostech umělé inteligence k 22. květnu 2025.
Claude Opus 4, označovaný jako vlajkový model společnosti Anthropic, byl firmou nazván „nejlepším programovacím modelem na světě“. Vede v žebříčku SWE-bench se skóre 72,5 % a na Terminal-bench dosahuje 43,2 %, přičemž poskytuje stabilní výkon i při dlouhotrvajících úlohách vyžadujících soustředěné úsilí v řádu tisíců kroků. Model dokáže pracovat nepřetržitě několik hodin, čímž výrazně překonává předchozí modely Sonnet a rozšiřuje možnosti AI agentů.
Claude Sonnet 4 představuje významný upgrade oproti Claude Sonnet 3.7, nabízí lepší programování a logické uvažování a zároveň přesněji reaguje na zadání. Zajímavostí je, že dosahuje 72,7 % na SWE-bench a při paralelním výpočtu v době testování až 80,2 % přesnosti – což znamená lepší programovací výkon než větší model Opus 4. Anthropic jej popisuje jako model, který vyvažuje „výkon a efektivitu pro interní i externí použití, s vylepšenou ovladatelností pro větší kontrolu nad implementacemi“.
Oba modely přinášejí nové možnosti, včetně rozšířeného přemýšlení s využitím nástrojů, což umožňuje modelu Claude střídat uvažování a použití nástrojů pro zlepšení odpovědí. Umí používat nástroje paralelně, přesněji plnit instrukce a – pokud jim vývojáři umožní přístup k lokálním souborům – výrazně zlepšují paměťové schopnosti, kdy dokážou extrahovat a ukládat klíčová fakta pro udržení kontinuity a budování tiché znalosti v čase.
Modely dokážou extrahovat a ukládat fakta do „paměti“, aby spolehlivěji zvládaly úkoly a postupně si budovaly tzv. „tichou znalost“. Opus 4 i Sonnet 4 jsou „hybridní“ modely schopné téměř okamžitých odpovědí i rozšířeného přemýšlení pro hlubší uvažování. Pokud je zapnutý režim rozšířeného uvažování, mohou si na odpověď vzít více času a nabídnout uživatelsky přívětivé shrnutí svého myšlenkového procesu.
Oba modely jsou dostupné prostřednictvím API společnosti Anthropic, Amazon Bedrock a Google Cloud Vertex AI. Ceny zůstávají stejné jako u předchozích modelů Opus a Sonnet: Opus 4 za 15/75 USD za milion tokenů (vstup/výstup) a Sonnet 4 za 3/15 USD. Pro individuální uživatele nabízí Anthropic odstupňované předplatné. Bezplatný tarif poskytuje přístup k modelu Claude Sonnet 4 s denními limity využití, zatímco tarif Pro (20 USD/měsíc nebo 200 USD/rok) nabízí přibližně pětinásobné využití oproti bezplatné verzi, přístup k oběma modelům Claude 4 Sonnet a Claude 4 Opus prostřednictvím výběru modelu a prioritní přístup v době vysokého zatížení.
Uvedení Claude 4 signalizuje novou éru velkých jazykových modelů. Tyto produkty představují skok v možnostech pro podniky, výzkum i kreativní aplikace díky 200 000-tokenovému kontextovému oknu, špičkovým výsledkům v programovacích a logických benchmarcích a robustnímu bezpečnostnímu rámci navrženému pro složité, rizikové a neustále se měnící reálné scénáře.