OpenAI har utökat sitt utbud av resonerande modeller med lanseringen av o3-mini, ett mindre men kraftfullt tillskott till "o"-serien som tänjer på gränserna för vad kompakta AI-modeller kan åstadkomma.
O3-mini presenteras som den mest kostnadseffektiva modellen i OpenAIs resonerande serie och levererar exceptionell prestanda inom STEM-områden samtidigt som den bibehåller den låga kostnaden och minskad latens från sin föregångare. Modellen flyttar fram gränserna för vad små modeller kan åstadkomma, med särskild styrka inom naturvetenskap, matematik och kodning – allt medan den bibehåller låg kostnad och minskad latens jämfört med OpenAI o1-mini.
Precis som sin föregångare o1 har o3-mini optimerats för STEM-resonemang. Med medelhögt resonemangsarbete matchar den o1:s prestanda inom matematik, kodning och naturvetenskap, men levererar dessutom snabbare svar. Utvärderingar av expertgranskare visade att o3-mini ger mer korrekta och tydligare svar, med starkare resonemangsförmåga, än o1-mini. Externa testare föredrog o3-minis svar framför o1-minis mer än hälften av gångerna. Modellen gjorde också 39 % färre "stora misstag" på "svåra verkliga frågor" i A/B-tester jämfört med o1-mini, och gav "tydligare" svar samtidigt som svarstiden var cirka 24 % snabbare.
En av o3-minis viktigaste innovationer är dess flexibla resonemangsförmåga. Utvecklare kan välja mellan tre nivåer av resonemangsinsats – låg, medel och hög – för att optimera efter sina specifika användningsområden. Denna flexibilitet gör att o3-mini kan "tänka hårdare" vid komplexa utmaningar eller prioritera hastighet när låg latens är viktig.
Modellen är den första lilla resonerande modellen från OpenAI som stödjer efterfrågade utvecklarfunktioner såsom funktionsanrop, strukturerade utdata och utvecklarmeddelanden, vilket gör den produktionsklar redan vid lansering. Som en del av lanseringen har OpenAI tredubblat gränsen för Plus- och Team-användare från 50 meddelanden per dag med o1-mini till 150 meddelanden per dag med o3-mini. Dessutom fungerar o3-mini nu med sök för att hitta aktuella svar med länkar till relevanta webbkällor. Från och med idag kan även användare på gratisplanen testa o3-mini genom att välja 'Reason' i meddelandefältet eller genom att återskapa ett svar – vilket markerar första gången en resonerande modell görs tillgänglig för gratisanvändare i ChatGPT.
Lanseringen av o3-mini sker vid en strategiskt viktig tidpunkt för OpenAI, då företaget förbereder sig för den kommande lanseringen av de kraftfullare modellerna o3 och o4-mini. I ett inlägg på X meddelade VD Sam Altman att företaget kommer att släppa två nya modeller – o3 och o4-mini – inom de närmaste veckorna, medan GPT-5 nu väntas några månader senare. Från och med april 2025 har o3-mini helt ersatts av o4-mini i ChatGPT och API:et. o4-mini erbjuder bättre prestanda på de flesta benchmarktester, tillför inbyggt multimodalt stöd och behåller verktygskompatibilitet – allt medan den förblir snabbare och mer prisvärd än o3.