في إنجاز بارز لمجال الذكاء الاصطناعي، تمكنت كل من OpenAI وGoogle DeepMind من تحقيق مستوى الميدالية الذهبية في أولمبياد الرياضيات الدولي لعام 2025، والذي يُعد أعرق مسابقة عالمية للشباب الموهوبين في الرياضيات.
حققت نماذج الذكاء الاصطناعي التابعة للشركتين نتيجة متطابقة بلغت 35 نقطة من أصل 42، حيث تمكنت من حل خمس مسائل من أصل ستة بشكل كامل. وتساوي هذه النتيجة الحد الأدنى للميدالية الذهبية في نسخة هذا العام من المسابقة، حيث حصل حوالي 11% فقط من بين 630 متسابقاً بشرياً (أي ما يقارب 67 طالباً) على الميدالية الذهبية.
تم تصحيح وتوثيق أداء نسخة Gemini المتقدمة من Google DeepMind رسمياً من قبل منسقي الأولمبياد، حيث أشار رئيس الأولمبياد، جريجور دولينار، إلى أن الحلول المقدمة كانت "مذهلة من عدة نواحٍ" و"واضحة ودقيقة ومعظمها سهل المتابعة". ويعد هذا تطوراً كبيراً مقارنة بالعام الماضي، عندما حصلت DeepMind على الميدالية الفضية باستخدام أنظمة متخصصة.
أما OpenAI، فقد اختبرت نموذجها التجريبي في الاستدلال على نفس المسائل وتحت نفس ظروف المسابقة—جلستان امتحان مدة كل منهما 4.5 ساعات دون اتصال بالإنترنت أو استخدام أدوات. وعلى الرغم من أن OpenAI لم تكن جزءاً من عملية التقييم الرسمية للأولمبياد، إلا أن الشركة استعانت بثلاثة من الحاصلين على ميداليات سابقة في الأولمبياد لتصحيح الحلول بشكل مستقل.
وقد تسببت توقيتات الإعلان عن النتائج في بعض التوتر بين الشركتين؛ حيث نشرت OpenAI نتائجها في 19 يوليو، بينما انتظرت Google DeepMind حتى 21 يوليو احتراماً لطلب مجلس الأولمبياد بعدم نشر النتائج إلا بعد التحقق الرسمي وتكريم الطلاب.
ويرى جونهيك جونغ، أستاذ الرياضيات في جامعة براون وباحث زائر لدى Google DeepMind، أن هذا الإنجاز يشير إلى أن الذكاء الاصطناعي بات على بعد أقل من عام من القدرة على مساعدة علماء الرياضيات في معالجة مسائل بحثية غير محلولة في طليعة الرياضيات. وقال جونغ لوكالة رويترز: "أعتقد أن اللحظة التي نستطيع فيها حل مسائل الاستدلال المعقدة باستخدام اللغة الطبيعية ستفتح الباب أمام تعاون حقيقي بين الذكاء الاصطناعي وعلماء الرياضيات".
ورغم أن هذا الإنجاز مثير للإعجاب، إلا أن بعض الخبراء يحذرون من أن مسائل الأولمبياد، رغم صعوبتها، أبسط من الناحية المفاهيمية من مسائل البحث الرياضي المتقدم. ويؤكد هذا الإنجاز على تطور قدرات الذكاء الاصطناعي في الاستدلال، لكنه لا يعني بالضرورة جاهزيته للتعامل مع جميع جوانب البحث الرياضي.