कृत्रिम बुद्धिमत्ता के क्षेत्र में एक महत्वपूर्ण उपलब्धि के रूप में, OpenAI ने घोषणा की है कि उसके नवीनतम प्रायोगिक रीजनिंग मॉडल ने 2025 के इंटरनेशनल मैथेमैटिकल ओलंपियाड (IMO) में गोल्ड मेडल स्तर का प्रदर्शन किया है, जिसे विश्व का सबसे प्रतिष्ठित गणित प्रतियोगिता माना जाता है।
इस मॉडल ने 2025 IMO की 6 में से 5 समस्याओं को सफलतापूर्वक हल किया, जिससे उसे 42 में से 35 अंक मिले—जो गोल्ड मेडल के प्रदर्शन के बराबर है। इस उपलब्धि को खास बनाता है कि एआई ने मानव प्रतिभागियों के समान सख्त नियमों के तहत प्रदर्शन किया: दो 4.5 घंटे के परीक्षा सत्र, जिनमें किसी भी उपकरण, इंटरनेट या बाहरी सहायता की अनुमति नहीं थी।
"यह पिछले मानकों की तुलना में निरंतर रचनात्मक सोच का एक नया स्तर दर्शाता है," OpenAI के शोधकर्ता अलेक्जेंडर वेई ने कहा, जिन्होंने इस सफलता की घोषणा की। वेई ने बताया कि तर्कशक्ति की समय सीमा अब साधारण गणितीय समस्याओं से बढ़कर IMO जैसी समस्याओं तक पहुंच गई है, जिन्हें शीर्ष मानव लगभग 0.1 मिनट में हल करते हैं, जबकि IMO की समस्याओं को हल करने में लगभग 100 मिनट का केंद्रित प्रयास लगता है।
पिछले एआई सिस्टम्स के विपरीत, जिन्हें खासतौर पर गणितीय प्रतियोगिताओं के लिए डिजाइन किया गया था, OpenAI का मॉडल एक सामान्य-उद्देश्यीय रीजनिंग भाषा मॉडल है, जिसमें रिइन्फोर्समेंट लर्निंग और टेस्ट-टाइम कंप्यूट स्केलिंग जैसी नई प्रायोगिक तकनीकों को शामिल किया गया है। मॉडल द्वारा प्रस्तुत किए गए प्रमाणों का मूल्यांकन तीन पूर्व IMO पदक विजेताओं ने स्वतंत्र रूप से किया, और अंतिम स्कोर सर्वसम्मति के बाद तय किए गए।
यह उपलब्धि अन्य प्रमुख एआई मॉडलों की तुलना में विशेष रूप से उल्लेखनीय है। हाल ही में MathArena.ai द्वारा किए गए मूल्यांकन में Gemini 2.5 Pro, Grok-4 और OpenAI के पुराने o3 मॉडल सहित प्रतियोगी, इन्हीं समस्याओं पर कांस्य पदक की सीमा तक भी नहीं पहुंच सके।
यह सफलता ऐसे समय आई है जब OpenAI आगामी महीनों में GPT-5 जारी करने की तैयारी कर रहा है। कई स्रोतों के अनुसार, GPT-5 OpenAI के विभिन्न विशेषीकृत मॉडलों—जिनमें इस IMO उपलब्धि में दिखाई गई रीजनिंग क्षमताएं भी शामिल हैं—को एक एकीकृत सिस्टम में बदल देगा, जिसमें एक स्मार्ट राउटर होगा जो प्रत्येक कार्य के लिए सबसे उपयुक्त तरीका स्वतः चुन सकेगा।
"IMO गोल्ड LLM एक प्रायोगिक शोध मॉडल है। हम अगले कुछ महीनों तक इतनी उच्च गणितीय क्षमता वाला कोई उत्पाद जारी करने की योजना नहीं बना रहे हैं," वेई ने स्पष्ट किया, जिससे संकेत मिलता है कि ये उन्नत रीजनिंग क्षमताएं भविष्य के सार्वजनिक संस्करणों में शामिल की जा सकती हैं।