OpenAI's o3-mini bringer avanceret ræsonnement til mindre modeller

OpenAI har lanceret o3-mini, en omkostningseffektiv AI-model optimeret til STEM-ræsonnement, samtidig med at den bevarer lave beregningskrav. Modellen udmærker sig inden for naturvidenskab, matematik og kodning og overgår sin forgænger o1-mini med 39% færre alvorlige fejl på komplekse problemer. Tilgængelig via både ChatGPT og API repræsenterer o3-mini et vigtigt skridt mod at demokratisere kraftfulde AI-ræsonnementsevner.

OpenAI har udvidet sin portefølje af ræsonnementsmodeller med lanceringen af o3-mini, et mindre, men kraftfuldt medlem af "o"-serien, der skubber grænserne for, hvad kompakte AI-modeller kan præstere.

Præsenteret som den mest omkostningseffektive model i OpenAIs ræsonnementsserie leverer o3-mini enestående resultater inden for STEM-områder, samtidig med at den bevarer de lave omkostninger og den reducerede latenstid fra forgængeren. Modellen udvider grænserne for, hvad små modeller kan opnå, og leverer fremragende STEM-evner – med særlig styrke inden for naturvidenskab, matematik og kodning – alt imens den fastholder de lave omkostninger og den reducerede latenstid fra OpenAI o1-mini.

Ligesom sin forgænger o1 er o3-mini optimeret til STEM-ræsonnement. Med mellem ræsonnementindsats matcher den o1's præstationer i matematik, kodning og naturvidenskab, men leverer hurtigere svar. Evalueringer fra eksperttestere viste, at o3-mini producerer mere præcise og klarere svar med stærkere ræsonnementsevner end o1-mini. Eksterne testere foretrak o3-minis svar frem for o1-minis mere end halvdelen af tiden. Modellen lavede også 39% færre "alvorlige fejl" på "svære, virkelighedsnære spørgsmål" i A/B-tests sammenlignet med o1-mini og leverede "klarere" svar, mens den svarede cirka 24% hurtigere.

En af o3-minis vigtigste innovationer er dens fleksible ræsonnementsevne. Udviklere kan vælge mellem tre niveauer af ræsonnementindsats – lav, mellem og høj – for at optimere til deres specifikke brugsscenarier. Denne fleksibilitet gør det muligt for o3-mini at "tænke hårdere" ved komplekse udfordringer eller prioritere hastighed, når lav latenstid er vigtig.

Modellen er den første lille ræsonnementsmodel fra OpenAI, der understøtter stærkt efterspurgte udviklerfunktioner som funktionkald, strukturerede outputs og udviklerbeskeder, hvilket gør den klar til produktion fra dag ét. Som en del af denne lancering har OpenAI tredoblet grænsen for antal beskeder for Plus- og Team-brugere fra 50 beskeder om dagen med o1-mini til 150 beskeder om dagen med o3-mini. Derudover fungerer o3-mini nu med søgning for at finde opdaterede svar med links til relevante webkilder. Fra i dag kan brugere på gratisplanen også prøve o3-mini ved at vælge 'Reason' i beskedkomponisten eller ved at regenerere et svar – hvilket markerer første gang, en ræsonnementsmodel er gjort tilgængelig for gratisbrugere i ChatGPT.

Lanceringen af o3-mini kommer på et strategisk tidspunkt for OpenAI, da virksomheden forbereder sig på den kommende lancering af de mere kraftfulde o3- og o4-mini-modeller. I et opslag på X annoncerede CEO Sam Altman, at virksomheden vil frigive to nye modeller – o3 og o4-mini – i løbet af de næste par uger, mens GPT-5 nu forventes nogle måneder senere. Fra april 2025 er o3-mini fuldt ud erstattet af o4-mini i ChatGPT og API'en. o4-mini leverer bedre resultater på de fleste benchmarks, tilføjer indbygget multimodal input og bevarer værktøjskompatibilitet – alt sammen mens den forbliver hurtigere og mere prisvenlig end o3.

Source:

OpenAI's o3-mini bringer avanceret ræsonnement til mindre modeller

Latest News

OpenAIs Operator får o3-opgradering og styrker AI-automatisering

Google DeepMinds Veo3 bringer lyd til AI-videoproduktion

SoftBank styrker AI-satsning med investering på 500 mio. dollars i Skild AI

Microsoft fyrer 9.000 medarbejdere og satser massivt på AI

WHO-topmøde fremviser AI-innovationer til globale sundhedsudfordringer

AI-forbruget stiger, mens digitale betalinger omfavner agentisk handel

OpenTools.ai lancerer AI-nyhedshub for branchefolk

Kvantcomputere Opnår Historisk Eksponentiel Hastighedsforøgelse

Google udvider Gemini 2.5-serien med omkostningseffektiv Flash-Lite-model

AI-robotter mestrer menneskelignende smidighed i banebrydende demo

OpenAI's o3-mini bringer avanceret ræsonnement til mindre modeller

Related Articles

SoftBank styrker AI-satsning med investering på 500 mio. dollars i Skild AI

Google DeepMinds Veo3 bringer lyd til AI-videoproduktion

OpenAIs Operator får o3-opgradering og styrker AI-automatisering

WHO-topmøde fremviser AI-innovationer til globale sundhedsudfordringer

Microsoft fyrer 9.000 medarbejdere og satser massivt på AI

Latest News

OpenAIs Operator får o3-opgradering og styrker AI-automatisering

Google DeepMinds Veo3 bringer lyd til AI-videoproduktion

SoftBank styrker AI-satsning med investering på 500 mio. dollars i Skild AI

Microsoft fyrer 9.000 medarbejdere og satser massivt på AI

WHO-topmøde fremviser AI-innovationer til globale sundhedsudfordringer

AI-forbruget stiger, mens digitale betalinger omfavner agentisk handel

OpenTools.ai lancerer AI-nyhedshub for branchefolk

Kvantcomputere Opnår Historisk Eksponentiel Hastighedsforøgelse

Google udvider Gemini 2.5-serien med omkostningseffektiv Flash-Lite-model

AI-robotter mestrer menneskelignende smidighed i banebrydende demo