menu
close

OpenAI lanserar GPT-4.1-familjen för att dominera AI-marknaden för kodning

OpenAI har lanserat en ny modellfamilj kallad GPT-4.1, inklusive standard-, mini- och nano-versioner, alla optimerade för kodning och instruktionstolkning med ett enormt kontextfönster på 1 miljon token. Dessa modeller, som endast finns tillgängliga via API, överträffar OpenAIs tidigare erbjudanden på kodningsbenchmarks, där flaggskeppet GPT-4.1 visar en förbättring på 21 % jämfört med GPT-4o. Lanseringen sker samtidigt som konkurrensen hårdnar med Googles Gemini 2.5 Pro och Anthropics Claude 3.7 Sonnet, som också tävlar om ledarskapet inom AI-kodning.
OpenAI lanserar GPT-4.1-familjen för att dominera AI-marknaden för kodning

OpenAI har lanserat en ny modellfamilj kallad GPT-4.1, inklusive GPT-4.1, GPT-4.1 mini och GPT-4.1 nano, som alla utmärker sig inom kodning och instruktionstolkning. De nya modellerna släpptes den 14 april och finns exklusivt tillgängliga via OpenAIs applikationsprogrammeringsgränssnitt (API). De överträffar företagets mest avancerade GPT-4o-modell på alla områden.

Modellerna har förbättrad kontextförståelse, med stöd för upp till 1 miljon token (ungefär 750 000 ord) och har uppdaterad kunskap fram till juni 2024. På SWE-bench Verified, ett mått på verkliga mjukvaruutvecklingsfärdigheter, klarar GPT-4.1 av 54,6 % av uppgifterna, jämfört med 33,2 % för GPT-4o. Detta speglar förbättringar i modellens förmåga att utforska kodförråd, slutföra uppgifter och producera kod som både körs och klarar tester.

"Vi har optimerat GPT-4.1 för verklig användning baserat på direkt feedback för att förbättra områden som utvecklare bryr sig mest om: frontend-kodning, färre onödiga ändringar, pålitlig formatföljning, efterlevnad av svarstruktur och ordning, konsekvent verktygsanvändning och mer," förklarade en talesperson för OpenAI. "Dessa förbättringar gör det möjligt för utvecklare att bygga agenter som är betydligt bättre på verkliga mjukvaruutvecklingsuppgifter."

De mindre varianterna erbjuder olika avvägningar mellan prestanda och kostnad. GPT-4.1 mini och nano är mer effektiva och snabbare på bekostnad av viss noggrannhet, och OpenAI säger att GPT-4.1 nano är dess snabbaste och billigaste modell någonsin. Prissättningen varierar avsevärt mellan modellerna: GPT-4.1 kostar 2 dollar per miljon inmatade token och 8 dollar per miljon utmatade token, GPT-4.1 mini kostar 0,40 dollar/miljon inmatade token och 1,60 dollar/miljon utmatade token, och GPT-4.1 nano kostar endast 0,10 dollar/miljon inmatade token och 0,40 dollar/miljon utmatade token.

Vid utvärderingar utöver kodning testade OpenAI GPT-4.1 med Video-MME, som mäter en modells förmåga att förstå innehåll i videor. GPT-4.1 nådde 72 % noggrannhet i kategorin "långa videor utan undertexter" och tog därmed förstaplatsen i detta benchmark.

Denna lansering ligger i linje med OpenAIs bredare ambitioner inom kodningsområdet. OpenAIs finanschef Sarah Friar diskuterade nyligen företagets vision om att skapa en "agentisk mjukvaruingenjör" som kan programmera hela appar från början till slut. "Den kan bokstavligen bygga en app åt dig – och inte bara bygga den, utan även utföra egen kvalitetssäkring, buggtestning och dokumentationsskrivning," sade Friar.

Marknaden för AI-modeller inom kodning blir alltmer konkurrensutsatt. Googles Gemini 2.5 Pro toppar för närvarande SWE-bench Verified-benchmarken med 63,8 %, medan Anthropics Claude 3.7 Sonnet når 62,3 % i standardläge och upp till 70,3 % i utökat tänkandeläge. Trots dessa imponerande benchmarkresultat medger OpenAI att även de bästa modellerna idag har svårt med uppgifter som inte skulle ställa till det för experter. Många studier har visat att kodgenererande modeller ofta misslyckas med att åtgärda, och till och med introducerar, säkerhetsbrister och buggar. GPT-4.1 blir också mindre pålitlig ju fler inmatade token den måste bearbeta.

Source: TechCrunch

Latest News