Ipinakilala ng Anthropic ang susunod nitong henerasyon ng AI models noong Mayo 22, 2025, sa paglabas ng Claude Opus 4 at Claude Sonnet 4 na may mga kakayahang nagpapalawak sa hangganan ng magagawa ng AI nang walang interbensyon ng tao.
Ang Claude Opus 4, na inilarawan ng Anthropic bilang "pinakamahusay na coding model sa mundo," ay nakakuha ng makasaysayang 72.5% na marka sa SWE-bench, isang mahigpit na benchmark sa software engineering na sumusukat sa performance sa mga totoong coding task. Sa pagsubok na isinagawa sa Rakuten, ipinakita ng modelong ito ang kahanga-hangang tibay sa pamamagitan ng awtonomong pagtatrabaho sa isang komplikadong open-source na proyekto sa loob ng halos pitong oras—isang malaking pagtalon mula sa ilang minutong atensyon ng mga naunang AI model.
Ang Claude Sonnet 4, na idinisenyo bilang mas episyenteng alternatibo sa Opus 4, ay naghatid ng mas mataas na kakayahan sa coding at pangangatwiran kumpara sa nauna nitong Claude Sonnet 3.7. Nakakagulat, mas mataas pa ang nakuha nitong marka sa SWE-bench na 72.7%, na tinalo ang mga kakumpitensya tulad ng OpenAI Codex-1 (72.1%) at Google Gemini 2.5 Pro (63.2%).
Parehong may hybrid reasoning capabilities ang dalawang modelo, na nagpapahintulot sa kanilang magpalit-palit mula sa halos agarang sagot hanggang sa mas malalim na pag-iisip para sa mas masusing pangangatwiran. Maaari silang gumamit ng mga tool gaya ng web search habang nagpoproseso ng impormasyon at—kapag may access sa lokal na files—kayang kumuha at mag-save ng mahahalagang impormasyon upang mapanatili ang continuity at makabuo ng kaalaman sa paglipas ng panahon.
Ang mga bagong modelong ito ay kumakatawan sa isang malaking pagbabago sa kakayahan ng AI, mula sa pagiging simpleng chatbot patungo sa pagiging awtonomong work agents na kayang humawak ng komplikado at sunod-sunod na workflow na umaabot sa libu-libong hakbang. Dahil dito, nagagawa na ng AI na tapusin ang mga proyektong tumatagal ng isang buong araw mula simula hanggang matapos habang pinananatili ang konteksto sa kabuuan.
Available ang Claude Sonnet 4 sa lahat ng gumagamit ng Claude, kabilang ang mga nasa libreng tier, habang ang Claude Opus 4 ay para lamang sa mga Pro, Max, Team, at Enterprise plan subscribers. Pareho ring makukuha ang dalawang modelo sa pamamagitan ng Anthropic API, Amazon Bedrock, at Google Cloud's Vertex AI, na may presyong kapareho ng mga naunang modelo: Opus 4 sa $15/$75 kada milyong tokens (input/output) at Sonnet 4 sa $3/$15.