menu
close

OpenAIs AI når guldnivå i matematikolympiadens utmaning

OpenAI har meddelat att dess experimentella resonemangsmodell har uppnått guldmedaljnivå på den Internationella matematikolympiaden (IMO) 2025, genom att lösa 5 av 6 problem under samma villkor som mänskliga deltagare. Detta genombrott markerar ett betydande framsteg inom AI:s resonemangsförmåga och visar på en uthållig kreativitet som tidigare ansetts vara unik för människor. Prestationen sker samtidigt som OpenAI förbereder lanseringen av GPT-5, som kommer att förena specialiserade modeller, inklusive avancerade resonemangsförmågor.
OpenAIs AI når guldnivå i matematikolympiadens utmaning

I en viktig milstolpe för artificiell intelligens har OpenAI meddelat att dess senaste experimentella resonemangsmodell har nått guldmedaljnivå vid den Internationella matematikolympiaden (IMO) 2025, allmänt betraktad som världens mest prestigefyllda matematiktävling.

Modellen lyckades lösa fem av sex problem från IMO 2025 och erhöll 35 av 42 möjliga poäng—motsvarande en guldmedalj. Det som gör denna prestation särskilt anmärkningsvärd är att AI:n arbetade under samma strikta villkor som mänskliga deltagare: två provpass på 4,5 timmar vardera, utan tillgång till verktyg, internet eller extern hjälp.

"Detta representerar en ny nivå av uthålligt kreativt tänkande jämfört med tidigare riktmärken," säger Alexander Wei, en OpenAI-forskare som offentliggjorde genombrottet. Wei påpekar att resonemangets tidshorisont har utvecklats från enkla matematikproblem som de bästa människorna löser på cirka 0,1 minuter, till IMO-problem som kräver ungefär 100 minuters koncentrerat arbete.

Till skillnad från tidigare AI-system som designats specifikt för matematiska tävlingar är OpenAIs modell en generell resonemangsmodell som integrerar nya experimentella tekniker inom förstärkningsinlärning och skalning av beräkningskraft vid testning. Tre tidigare IMO-medaljörer rättade oberoende modellens inlämnade lösningar, och poängen fastställdes efter enhällig överenskommelse.

Denna prestation är särskilt anmärkningsvärd i jämförelse med andra ledande AI-modeller. I en nyligen genomförd utvärdering av MathArena.ai misslyckades konkurrenter som Gemini 2.5 Pro, Grok-4 och OpenAIs tidigare o3-modell att ens nå bronsmedaljnivå på samma problem.

Tidpunkten för detta genombrott sammanfaller med OpenAIs kommande lansering av GPT-5, som förväntas släppas inom de närmaste månaderna. Enligt flera källor kommer GPT-5 att förena OpenAIs olika specialiserade modeller—including de resonemangsförmågor som demonstrerats i denna IMO-prestation—till ett enda system med en smart router som automatiskt väljer den mest lämpliga metoden för varje uppgift.

"IMO-guld-LLM är en experimentell forskningsmodell. Vi planerar inte att släppa något med denna nivå av matematisk förmåga på flera månader," förtydligar Wei, och antyder att dessa avancerade resonemangsförmågor kan komma att införlivas i framtida publika versioner.

Source: Analyticsindiamag

Latest News