menu
close

Inilunsad ng Anthropic ang Claude 4: Naglatag ng Bagong Pamantayan sa AI Coding

Kamakailan ay inilunsad ng Anthropic ang Claude Opus 4 at Claude Sonnet 4, na nagtatakda ng mga bagong pamantayan sa kakayahan ng AI sa coding at pangangatwiran. Nangunguna ang Claude Opus 4 sa mga industry benchmark na may 72.5% sa SWE-bench, habang ang Sonnet 4 ay nag-aalok ng mataas na performance sa mas abot-kayang presyo. Parehong tampok ng dalawang modelo ang hybrid reasoning, na nagpapahintulot sa kanila na magpalit-palit sa pagitan ng mabilisang sagot at mas malalim na pag-iisip gamit ang tool integration, na lubos na nagpapahusay sa kanilang kakayahang humawak ng masalimuot at sunod-sunod na mga gawain.
Inilunsad ng Anthropic ang Claude 4: Naglatag ng Bagong Pamantayan sa AI Coding

Opisyal nang inilunsad ng Anthropic ang pinakabagong henerasyon ng kanilang AI models, ang Claude Opus 4 at Claude Sonnet 4, na nagmamarka ng malaking hakbang sa kakayahan ng artificial intelligence noong Mayo 22, 2025.

Ang Claude Opus 4, na itinuturing na pangunahing modelo ng Anthropic, ay tinaguriang "pinakamahusay na coding model sa mundo" ng kumpanya. Nangunguna ito sa SWE-bench na may iskor na 72.5% at Terminal-bench na 43.2%, na nagpapakita ng matatag na performance sa mga gawain na nangangailangan ng tuloy-tuloy at tutok na pagsisikap sa libu-libong hakbang. Kayang magtrabaho ng modelo ng ilang oras nang tuluy-tuloy, na malayo ang inangat kumpara sa mga naunang Sonnet models at pinalawak ang maaaring magawa ng mga AI agent.

Ang Claude Sonnet 4 ay malaking pag-angat mula sa Claude Sonnet 3.7, na nag-aalok ng mas mataas na antas ng coding at pangangatwiran habang mas eksaktong tumutugon sa mga tagubilin. Kapansin-pansin, nakamit nito ang 72.7% sa SWE-bench, at sa parallel test-time compute, umabot sa 80.2% accuracy—mas mataas pa sa mas malaking Opus 4 model. Inilarawan ito ng Anthropic bilang balanse ng "performance at efficiency para sa panloob at panlabas na paggamit, na may pinahusay na steerability para sa higit na kontrol sa implementasyon."

Parehong nagpakilala ang dalawang modelo ng makapangyarihang bagong kakayahan, kabilang ang extended thinking gamit ang mga tool, na nagpapahintulot kay Claude na magpalit-palit sa pagitan ng pangangatwiran at paggamit ng mga tool upang mapabuti ang mga sagot. Kayang gumamit ng mga tool nang sabay-sabay, mas eksaktong sumunod sa mga tagubilin, at—kapag binigyan ng access sa lokal na files ng mga developer—malaki ang pagbuti ng memory capabilities, na kayang kumuha at magtago ng mahahalagang impormasyon upang mapanatili ang continuity at makabuo ng implicit na kaalaman sa paglipas ng panahon.

Kayang kumuha at magtago ng mga impormasyon sa "memory" upang mas maaasahan sa paghawak ng mga gawain, na bumubuo ng tinatawag ng Anthropic na "tacit knowledge" habang tumatagal. Parehong "hybrid" models ang Opus 4 at Sonnet 4 na may kakayahang magbigay ng halos instant na sagot at extended thinking para sa mas malalim na pangangatwiran. Kapag naka-on ang reasoning mode, maaari silang maglaan ng mas maraming oras sa pag-iisip ng mga posibleng solusyon bago sumagot, at nagpapakita ng "user-friendly" na buod ng kanilang thought process.

Available ang parehong modelo sa Anthropic API, Amazon Bedrock, at Google Cloud's Vertex AI. Nanatiling pareho ang presyo sa mga naunang Opus at Sonnet models: Opus 4 sa $15/$75 kada milyong token (input/output) at Sonnet 4 sa $3/$15. Para sa mga indibidwal na user, nag-aalok ang Anthropic ng tiered subscription plans. Ang libreng plano ay nagbibigay ng access sa Claude Sonnet 4 na may daily usage limits, habang ang Pro plan ($20/buwan o $200/taon) ay nag-aalok ng halos limang beses na mas mataas na paggamit kaysa sa libreng plano, access sa parehong Claude 4 Sonnet at Claude 4 Opus sa pamamagitan ng model selector, at priority access tuwing mataas ang demand.

Ang paglulunsad ng Claude 4 ay hudyat ng bagong panahon sa malalaking language models. Ang mga modelong ito ay kumakatawan sa malaking pagtalon sa maaaring magawa para sa enterprise, pananaliksik, at malikhaing aplikasyon gamit ang 200,000-token context window, pinakamahusay sa coding at reasoning benchmarks, at matatag na safety framework na idinisenyo para sa masalimuot, mataas ang panganib, at pabago-bagong mga sitwasyon sa totoong mundo.

Source:

Latest News