menu
close

OpenAI esittelee GPT-4.1-malliperheen hallitsemaan tekoälykoodauksen markkinoita

OpenAI on julkaissut uuden GPT-4.1-malliperheen, johon kuuluvat standardi-, mini- ja nano-versiot. Kaikki mallit on optimoitu koodaukseen ja ohjeiden seuraamiseen, ja niissä on valtava, miljoonan tokenin kontekstiraja. Nämä vain API:n kautta saatavilla olevat mallit päihittävät OpenAI:n aiemmat ratkaisut koodausvertailuissa, ja lippulaivamalli GPT-4.1 parantaa GPT-4o:n tulosta 21 prosentilla. Julkaisu osuu aikaan, jolloin kilpailu Googlen Gemini 2.5 Pron ja Anthropicin Claude 3.7 Sonnetin kanssa AI-koodauksen kentällä kiihtyy.
OpenAI esittelee GPT-4.1-malliperheen hallitsemaan tekoälykoodauksen markkinoita

OpenAI on julkaissut uuden GPT-4.1-malliperheen, johon kuuluvat GPT-4.1, GPT-4.1 mini ja GPT-4.1 nano. Kaikki nämä mallit loistavat koodauksessa ja ohjeiden seuraamisessa. Uudet mallit julkaistiin 14. huhtikuuta, ja ne ovat saatavilla yksinoikeudella OpenAI:n sovellusrajapinnan (API) kautta. Ne päihittävät yhtiön edistyneimmän GPT-4o-mallin kaikilla osa-alueilla.

Malleissa on parannettu kontekstin ymmärrystä: ne tukevat jopa miljoonaa tokenia (noin 750 000 sanaa) ja sisältävät päivitetyn tietopohjan kesäkuuhun 2024 asti. SWE-bench Verified -mittarilla, joka arvioi ohjelmistokehityksen todellisia taitoja, GPT-4.1 suorittaa 54,6 % tehtävistä, kun GPT-4o:n tulos on 33,2 %. Tämä kuvastaa mallin kykyä tutkia koodivarastoja, viimeistellä tehtäviä ja tuottaa koodia, joka toimii ja läpäisee testit.

"Olemme optimoineet GPT-4.1:n tosielämän käyttöön suoran palautteen pohjalta, jotta se paranee kehittäjille tärkeimmissä asioissa: frontend-koodauksessa, ylimääräisten muokkausten vähentämisessä, formaattien luotettavassa noudattamisessa, vastausrakenteen ja järjestyksen säilyttämisessä, työkalujen johdonmukaisessa käytössä ja muussa", OpenAI:n edustaja kertoo. "Nämä parannukset mahdollistavat kehittäjille huomattavasti parempien ohjelmistoagenttien rakentamisen oikeisiin ohjelmistokehitystehtäviin."

Pienemmät mallit tarjoavat erilaisia suorituskyky-hinta-suhteita. GPT-4.1 mini ja nano ovat tehokkaampia ja nopeampia, mutta tarkkuus hieman kärsii. OpenAI:n mukaan GPT-4.1 nano on yhtiön nopein ja edullisin malli koskaan. Hinnoittelu vaihtelee merkittävästi: GPT-4.1 maksaa 2 dollaria miljoonalta syötetokenilta ja 8 dollaria miljoonalta tulostokenilta, GPT-4.1 mini 0,40 $ / miljoona syötetokenia ja 1,60 $ / miljoona tulostokenia, ja GPT-4.1 nano vain 0,10 $ / miljoona syötetokenia ja 0,40 $ / miljoona tulostokenia.

Koodaamisen lisäksi OpenAI testasi GPT-4.1:tä Video-MME-mittarilla, joka arvioi mallin kykyä ymmärtää videosisältöä. GPT-4.1 saavutti 72 % tarkkuuden "pitkät, ei tekstityksiä" -videoluokassa, nousten mittarin kärkeen.

Julkaisu tukee OpenAI:n laajempia tavoitteita koodauksen saralla. OpenAI:n talousjohtaja Sarah Friar kertoi äskettäin yhtiön visiosta luoda "agenttimainen ohjelmistokehittäjä", joka kykenee ohjelmoimaan kokonaisia sovelluksia alusta loppuun. "Se voi käytännössä rakentaa sovelluksen puolestasi – ja ei pelkästään rakentaa sitä, vaan myös hoitaa laadunvarmistuksen, bugitestauksen ja dokumentaation kirjoittamisen", Friar totesi.

Tekoälykoodauksen mallikenttä käy yhä kilpailullisemmaksi. Googlen Gemini 2.5 Pro johtaa tällä hetkellä SWE-bench Verified -vertailua tuloksella 63,8 %, kun taas Anthropicin Claude 3.7 Sonnet yltää 62,3 prosenttiin normaalitilassa ja jopa 70,3 prosenttiin laajennetun ajattelun tilassa. Vaikka tulokset ovat vaikuttavia, OpenAI myöntää, että parhaatkaan mallit eivät vielä selviä tehtävistä, jotka eivät tuottaisi ongelmia asiantuntijoille. Useat tutkimukset ovat osoittaneet, että koodia tuottavat mallit epäonnistuvat usein korjaamaan – ja jopa aiheuttavat – tietoturva-aukkoja ja bugeja. GPT-4.1:n luotettavuus heikkenee myös, mitä enemmän syötetokenia sillä täytyy käsitellä.

Source: TechCrunch

Latest News