OpenAI har udvidet sin portefølje af ræsonnementsmodeller med lanceringen af o3-mini, et mindre, men kraftfuldt medlem af "o"-serien, der skubber grænserne for, hvad kompakte AI-modeller kan præstere.
Præsenteret som den mest omkostningseffektive model i OpenAIs ræsonnementsserie leverer o3-mini enestående resultater inden for STEM-områder, samtidig med at den bevarer de lave omkostninger og den reducerede latenstid fra forgængeren. Modellen udvider grænserne for, hvad små modeller kan opnå, og leverer fremragende STEM-evner – med særlig styrke inden for naturvidenskab, matematik og kodning – alt imens den fastholder de lave omkostninger og den reducerede latenstid fra OpenAI o1-mini.
Ligesom sin forgænger o1 er o3-mini optimeret til STEM-ræsonnement. Med mellem ræsonnementindsats matcher den o1's præstationer i matematik, kodning og naturvidenskab, men leverer hurtigere svar. Evalueringer fra eksperttestere viste, at o3-mini producerer mere præcise og klarere svar med stærkere ræsonnementsevner end o1-mini. Eksterne testere foretrak o3-minis svar frem for o1-minis mere end halvdelen af tiden. Modellen lavede også 39% færre "alvorlige fejl" på "svære, virkelighedsnære spørgsmål" i A/B-tests sammenlignet med o1-mini og leverede "klarere" svar, mens den svarede cirka 24% hurtigere.
En af o3-minis vigtigste innovationer er dens fleksible ræsonnementsevne. Udviklere kan vælge mellem tre niveauer af ræsonnementindsats – lav, mellem og høj – for at optimere til deres specifikke brugsscenarier. Denne fleksibilitet gør det muligt for o3-mini at "tænke hårdere" ved komplekse udfordringer eller prioritere hastighed, når lav latenstid er vigtig.
Modellen er den første lille ræsonnementsmodel fra OpenAI, der understøtter stærkt efterspurgte udviklerfunktioner som funktionkald, strukturerede outputs og udviklerbeskeder, hvilket gør den klar til produktion fra dag ét. Som en del af denne lancering har OpenAI tredoblet grænsen for antal beskeder for Plus- og Team-brugere fra 50 beskeder om dagen med o1-mini til 150 beskeder om dagen med o3-mini. Derudover fungerer o3-mini nu med søgning for at finde opdaterede svar med links til relevante webkilder. Fra i dag kan brugere på gratisplanen også prøve o3-mini ved at vælge 'Reason' i beskedkomponisten eller ved at regenerere et svar – hvilket markerer første gang, en ræsonnementsmodel er gjort tilgængelig for gratisbrugere i ChatGPT.
Lanceringen af o3-mini kommer på et strategisk tidspunkt for OpenAI, da virksomheden forbereder sig på den kommende lancering af de mere kraftfulde o3- og o4-mini-modeller. I et opslag på X annoncerede CEO Sam Altman, at virksomheden vil frigive to nye modeller – o3 og o4-mini – i løbet af de næste par uger, mens GPT-5 nu forventes nogle måneder senere. Fra april 2025 er o3-mini fuldt ud erstattet af o4-mini i ChatGPT og API'en. o4-mini leverer bedre resultater på de fleste benchmarks, tilføjer indbygget multimodal input og bevarer værktøjskompatibilitet – alt sammen mens den forbliver hurtigere og mere prisvenlig end o3.