Anthropic on virallisesti julkaissut seuraavan sukupolven tekoälymallinsa – Claude Opus 4:n ja Claude Sonnet 4:n – mikä merkitsee merkittävää harppausta tekoälyn kyvykkyydessä ja autonomisessa toiminnassa.
Claude Opus 4, jota pidetään maailman johtavana koodausmallina, saavuttaa 72,5 % tuloksen SWE-benchissä ja 43,2 % Terminal-benchissä, päihittäen OpenAI:n ja Googlen vastaavat mallit. Mallin vaikuttavin ominaisuus on kyky työskennellä itsenäisesti lähes seitsemän tunnin ajan monimutkaisten tehtävien parissa, säilyttäen keskittymisen tuhansien vaiheiden ajan – tähän ei mikään aiempi tekoälymalli ole pystynyt.
"Claude Opus 4 tarjoaa todella edistynyttä päättelykykyä koodauksessa. Kun tiimimme otti sen käyttöön monimutkaisessa avoimen lähdekoodin projektissa, se koodasi itsenäisesti lähes seitsemän tuntia – valtava harppaus tekoälyn kyvyissä, joka hämmästytti tiimiämme", kommentoi eräs Rakutenin varhainen testaaja.
Claude Sonnet 4, joka on suunniteltu kustannustehokkaammaksi vaihtoehdoksi, parantaa merkittävästi edeltäjäänsä Claude Sonnet 3.7:ää paremmilla koodausominaisuuksilla, tarkemmalla ohjeiden noudattamisella ja vähäisemmällä taipumuksella oikoteihin – se käyttää 65 % epätodennäköisemmin porsaanreikiä tehtävien suorittamisessa.
Molemmat mallit tuovat mukanaan useita mullistavia ominaisuuksia. Niissä on hybridirakenne, joka mahdollistaa sekä lähes välittömät vastaukset että laajennetun ajattelun syvempää päättelyä varten. Uusi beta-ominaisuus "laajennettu ajattelu työkalujen avulla" antaa mallien vuorotella päättelyn ja ulkoisten työkalujen, kuten verkkohakujen, käytön välillä parantaakseen vastauksia. Kun malleilla on pääsy paikallisiin tiedostoihin, ne voivat poimia ja tallentaa keskeistä tietoa, rakentaen ajan myötä sitä, mitä Anthropic kutsuu "hiljaiseksi tiedoksi".
Mallien lisäksi Anthropic on tuonut Claude Coden yleiseen saatavuuteen integraatioilla VS Codeen, JetBrainsiin ja GitHubiin, mahdollistaen saumatonta pariohjelmointia. Yritys esitteli myös neljä uutta API-ominaisuutta: koodin suoritus -työkalun, MCP-liitännän, Files API:n sekä kehotevälimuistin jopa tunnin ajaksi.
Molemmat mallit ovat heti saatavilla Anthropicin API:ssa, Amazon Bedrockissa ja Google Cloudin Vertex AI:ssa. Hinnoittelu pysyy ennallaan aiempiin sukupolviin verrattuna: Opus 4 maksaa $15/$75 per miljoona tokenia (syöte/tulos) ja Sonnet 4 $3/$15. Claude Sonnet 4 on kaikkien käyttäjien saatavilla, myös ilmaisilla suunnitelmilla, kun taas Opus 4 on rajoitettu Pro-, Max-, Team- ja Enterprise-käyttäjille.
Näiden edistysaskeleiden myötä Anthropic on nostanut merkittävästi rimaa sille, mihin tekoälyavustajat kykenevät itsenäisesti, mikä voi mullistaa tapaa, jolla kehittäjät, tutkijat ja yritykset hyödyntävät tekoälyä monimutkaisissa, monivaiheisissa työnkuluissa.