Anthropic on virallisesti julkaissut seuraavan sukupolven tekoälymallinsa, Claude Opus 4:n ja Claude Sonnet 4:n, mikä merkitsee merkittävää edistysaskelta tekoälyn kyvykkyydessä 22. toukokuuta 2025.
Claude Opus 4, jota yhtiö pitää lippulaivamallinaan, on nimetty "maailman parhaaksi koodausmalliksi". Se johtaa SWE-bench-vertailussa 72,5 %:n tuloksella ja Terminal-benchissä 43,2 %:lla, tarjoten tasaisen suorituskyvyn pitkäkestoisissa tehtävissä, jotka vaativat keskittynyttä työskentelyä tuhansien vaiheiden ajan. Malli pystyy työskentelemään yhtäjaksoisesti useita tunteja, mikä ylittää aiemmat Sonnet-mallit huomattavasti ja laajentaa tekoälyagenttien mahdollisuuksia.
Claude Sonnet 4 on merkittävä päivitys Claude Sonnet 3.7:ään verrattuna, tarjoten parempaa koodaus- ja päättelykykyä sekä tarkempia vastauksia ohjeisiin. Mielenkiintoista kyllä, se saavuttaa 72,7 % SWE-benchissä ja rinnakkaisella testiaikaisella laskennalla jopa 80,2 % tarkkuuden — tarjoten parempaa koodauskykyä kuin suurempi Opus 4 -malli. Anthropic kuvailee sitä tasapainoksi suorituskyvyn ja tehokkuuden välillä sekä sisäisiin että ulkoisiin käyttötapauksiin, ja siinä on parannettu ohjattavuus toteutusten hallintaan.
Molemmat mallit tuovat mukanaan uusia tehokkaita ominaisuuksia, kuten laajennetun ajattelun työkalujen avulla, jolloin Claude voi vaihdella päättelyn ja työkalujen käytön välillä parantaakseen vastauksiaan. Mallit voivat käyttää työkaluja rinnakkain, noudattaa ohjeita entistä tarkemmin ja — kun kehittäjät antavat pääsyn paikallisiin tiedostoihin — osoittaa merkittävästi parantunutta muistia, poimien ja tallentaen keskeisiä tietoja jatkuvuuden ja hiljaisen tiedon rakentamiseksi ajan myötä.
Mallit voivat poimia ja tallentaa faktoja "muistiinsa" suorittaakseen tehtäviä luotettavammin, rakentaen Anthropicin kuvaamaa "hiljaista tietoa" ajan kuluessa. Sekä Opus 4 että Sonnet 4 ovat "hybridimalleja", jotka kykenevät sekä lähes välittömiin vastauksiin että laajempaan ajatteluun syvällisempää päättelyä varten. Kun päättelytila on käytössä, ne voivat käyttää enemmän aikaa mahdollisten ratkaisujen harkintaan ennen vastaamista ja esittää käyttäjäystävällisen yhteenvedon ajatusprosessistaan.
Molemmat mallit ovat saatavilla Anthropicin API:n, Amazon Bedrockin ja Google Cloudin Vertex AI:n kautta. Hinnoittelu pysyy samana kuin aiemmissa Opus- ja Sonnet-malleissa: Opus 4 maksaa $15/$75 per miljoona tokenia (syöte/tulos) ja Sonnet 4 $3/$15. Yksittäisille käyttäjille Anthropic tarjoaa porrastettuja tilausvaihtoehtoja. Ilmainen suunnitelma antaa pääsyn Claude Sonnet 4:ään päivittäisillä käyttörajoilla, kun taas Pro-suunnitelma ($20/kk tai $200/vuosi) tarjoaa noin viisi kertaa enemmän käyttöä kuin ilmainen suunnitelma, pääsyn sekä Claude 4 Sonnetiin että Claude 4 Opukseen mallivalitsimen kautta sekä etusijan ruuhka-aikoina.
Claude 4:n julkaisu merkitsee uuden aikakauden alkua suurissa kielimalleissa. Nämä ratkaisut edustavat harppausta yritys-, tutkimus- ja luovissa sovelluksissa 200 000 tokenin konteksti-ikkunalla, alan parhailla koodaus- ja päättelytuloksilla sekä vankalla turvallisuuskehyksellä, joka on suunniteltu monimutkaisiin, riskialttiisiin ja jatkuvasti muuttuviin tosielämän tilanteisiin.