Anthropic julkaisi Claude 4:n: Uudet standardit tekoälykoodauksessa

Anthropic on äskettäin lanseerannut Claude Opus 4:n ja Claude Sonnet 4:n, jotka asettavat uudet standardit tekoälyn koodaus- ja päättelykyvyille. Claude Opus 4 johtaa alan vertailuja SWE-benchissä 72,5 %:n tuloksella, kun taas Sonnet 4 tarjoaa huippuluokan suorituskykyä edullisemmalla hinnalla. Molemmissa malleissa on hybridipäättely, jonka ansiosta ne voivat vaihdella välittömien vastausten ja pidemmän ajattelun välillä työkalujen integroinnin avulla, mikä parantaa merkittävästi niiden kykyä käsitellä monimutkaisia, monivaiheisia tehtäviä.

Anthropic on virallisesti julkaissut seuraavan sukupolven tekoälymallinsa, Claude Opus 4:n ja Claude Sonnet 4:n, mikä merkitsee merkittävää edistysaskelta tekoälyn kyvykkyydessä 22. toukokuuta 2025.

Claude Opus 4, jota yhtiö pitää lippulaivamallinaan, on nimetty "maailman parhaaksi koodausmalliksi". Se johtaa SWE-bench-vertailussa 72,5 %:n tuloksella ja Terminal-benchissä 43,2 %:lla, tarjoten tasaisen suorituskyvyn pitkäkestoisissa tehtävissä, jotka vaativat keskittynyttä työskentelyä tuhansien vaiheiden ajan. Malli pystyy työskentelemään yhtäjaksoisesti useita tunteja, mikä ylittää aiemmat Sonnet-mallit huomattavasti ja laajentaa tekoälyagenttien mahdollisuuksia.

Claude Sonnet 4 on merkittävä päivitys Claude Sonnet 3.7:ään verrattuna, tarjoten parempaa koodaus- ja päättelykykyä sekä tarkempia vastauksia ohjeisiin. Mielenkiintoista kyllä, se saavuttaa 72,7 % SWE-benchissä ja rinnakkaisella testiaikaisella laskennalla jopa 80,2 % tarkkuuden — tarjoten parempaa koodauskykyä kuin suurempi Opus 4 -malli. Anthropic kuvailee sitä tasapainoksi suorituskyvyn ja tehokkuuden välillä sekä sisäisiin että ulkoisiin käyttötapauksiin, ja siinä on parannettu ohjattavuus toteutusten hallintaan.

Molemmat mallit tuovat mukanaan uusia tehokkaita ominaisuuksia, kuten laajennetun ajattelun työkalujen avulla, jolloin Claude voi vaihdella päättelyn ja työkalujen käytön välillä parantaakseen vastauksiaan. Mallit voivat käyttää työkaluja rinnakkain, noudattaa ohjeita entistä tarkemmin ja — kun kehittäjät antavat pääsyn paikallisiin tiedostoihin — osoittaa merkittävästi parantunutta muistia, poimien ja tallentaen keskeisiä tietoja jatkuvuuden ja hiljaisen tiedon rakentamiseksi ajan myötä.

Mallit voivat poimia ja tallentaa faktoja "muistiinsa" suorittaakseen tehtäviä luotettavammin, rakentaen Anthropicin kuvaamaa "hiljaista tietoa" ajan kuluessa. Sekä Opus 4 että Sonnet 4 ovat "hybridimalleja", jotka kykenevät sekä lähes välittömiin vastauksiin että laajempaan ajatteluun syvällisempää päättelyä varten. Kun päättelytila on käytössä, ne voivat käyttää enemmän aikaa mahdollisten ratkaisujen harkintaan ennen vastaamista ja esittää käyttäjäystävällisen yhteenvedon ajatusprosessistaan.

Molemmat mallit ovat saatavilla Anthropicin API:n, Amazon Bedrockin ja Google Cloudin Vertex AI:n kautta. Hinnoittelu pysyy samana kuin aiemmissa Opus- ja Sonnet-malleissa: Opus 4 maksaa $15/$75 per miljoona tokenia (syöte/tulos) ja Sonnet 4 $3/$15. Yksittäisille käyttäjille Anthropic tarjoaa porrastettuja tilausvaihtoehtoja. Ilmainen suunnitelma antaa pääsyn Claude Sonnet 4:ään päivittäisillä käyttörajoilla, kun taas Pro-suunnitelma ($20/kk tai $200/vuosi) tarjoaa noin viisi kertaa enemmän käyttöä kuin ilmainen suunnitelma, pääsyn sekä Claude 4 Sonnetiin että Claude 4 Opukseen mallivalitsimen kautta sekä etusijan ruuhka-aikoina.

Claude 4:n julkaisu merkitsee uuden aikakauden alkua suurissa kielimalleissa. Nämä ratkaisut edustavat harppausta yritys-, tutkimus- ja luovissa sovelluksissa 200 000 tokenin konteksti-ikkunalla, alan parhailla koodaus- ja päättelytuloksilla sekä vankalla turvallisuuskehyksellä, joka on suunniteltu monimutkaisiin, riskialttiisiin ja jatkuvasti muuttuviin tosielämän tilanteisiin.

Source:

Anthropic julkaisi Claude 4:n: Uudet standardit tekoälykoodauksessa

Latest News

FDA:n tekoälytyökalu lääkinnällisten laitteiden arviointiin kohtaa teknisiä haasteita

Amazonin tekoälypohjainen Alexa Plus haastaa puheavustajamarkkinat

Google julkaisee Gemini 2.5 Pro -mallin kehittyneellä päättelykyvyllä kesäkuussa

Applen WWDC 2025: AI-strategia laahaa perässä – suuri design-uudistus pääroolissa

Reddit haastaa Anthropicin oikeuteen tekoälyn datan keruusta

Amazonin robottikuriirit: Humanoiditoimitusrobotit testivaiheessa

Kiina estää Applen ja Alibaban tekoälyjulkaisun Trumpin kauppasodan keskellä

Anthropicin tekoälymalli uhkailee kiristyksellä sulkemisen uhatessa

Amazon sijoittaa 10 miljardia dollaria maaseudun Pohjois-Carolinaan tekoälykeskuksen rakentamiseen

Google esittelee SynthID Detectorin tekoälysisällön tunnistamiseen

Anthropic julkaisi Claude 4:n: Uudet standardit tekoälykoodauksessa

Related Articles

Amazonin tekoälypohjainen Alexa Plus haastaa puheavustajamarkkinat

Google julkaisee Gemini 2.5 Pro -mallin kehittyneellä päättelykyvyllä kesäkuussa

Applen WWDC 2025: AI-strategia laahaa perässä – suuri design-uudistus pääroolissa

Reddit haastaa Anthropicin oikeuteen tekoälyn datan keruusta

Anthropicin tekoälymalli uhkailee kiristyksellä sulkemisen uhatessa

Latest News

FDA:n tekoälytyökalu lääkinnällisten laitteiden arviointiin kohtaa teknisiä haasteita

Amazonin tekoälypohjainen Alexa Plus haastaa puheavustajamarkkinat

Google julkaisee Gemini 2.5 Pro -mallin kehittyneellä päättelykyvyllä kesäkuussa

Applen WWDC 2025: AI-strategia laahaa perässä – suuri design-uudistus pääroolissa

Reddit haastaa Anthropicin oikeuteen tekoälyn datan keruusta

Amazonin robottikuriirit: Humanoiditoimitusrobotit testivaiheessa

Kiina estää Applen ja Alibaban tekoälyjulkaisun Trumpin kauppasodan keskellä

Anthropicin tekoälymalli uhkailee kiristyksellä sulkemisen uhatessa

Amazon sijoittaa 10 miljardia dollaria maaseudun Pohjois-Carolinaan tekoälykeskuksen rakentamiseen

Google esittelee SynthID Detectorin tekoälysisällön tunnistamiseen