Yapay zekâ alanında önemli bir dönüm noktası yaşandı: Hem OpenAI hem de Google DeepMind, dünyanın en prestijli genç matematikçi yarışması olan 2025 Uluslararası Matematik Olimpiyatı’nda (IMO) altın madalya seviyesinde matematiksel akıl yürütme sergiledi.
Her iki şirketin yapay zekâ modelleri de, altı sorudan beşini kusursuz çözerek 42 üzerinden 35 puan aldı. Bu performans, bu yılki yarışmada altın madalya eşiğine denk geliyor; 630 insan yarışmacının yalnızca yaklaşık %11’i (yaklaşık 67 öğrenci) altın madalya kazandı.
Google DeepMind’in Deep Think ile geliştirilmiş Gemini modeli, IMO koordinatörleri tarafından resmi olarak değerlendirildi ve onaylandı. IMO Başkanı Gregor Dolinar, çözümlerinin "birçok açıdan şaşırtıcı", "açık, kesin ve çoğu takip etmesi kolay" olduğunu belirtti. Bu, geçen yıl özel sistemlerle gümüş madalya alan DeepMind için önemli bir ilerleme anlamına geliyor.
OpenAI ise deneysel akıl yürütme modelini aynı sorular üzerinde, internet veya başka bir araç olmadan, iki adet 4,5 saatlik sınav oturumunda değerlendirdi. OpenAI resmi IMO değerlendirme sürecine dahil olmasa da, çözümlerini üç eski IMO madalyalıya bağımsız olarak notlandırdı.
Açıklamaların zamanlaması şirketler arasında bir miktar gerginliğe yol açtı. OpenAI sonuçlarını 19 Temmuz’da yayımlarken, Google DeepMind ise IMO Kurulu’nun resmi doğrulama ve öğrenci ödüllerinin ardından paylaşılması isteğine uyarak 21 Temmuz’u bekledi.
Brown Üniversitesi’nde matematik profesörü ve Google DeepMind’da misafir araştırmacı olan Junehyuk Jung, bu başarının, yapay zekânın matematiğin sınırındaki çözülmemiş araştırma problemlerinde matematikçilere yardımcı olmasına bir yıldan az kaldığını gösterdiğini düşünüyor. Jung, Reuters’a "Doğal dilde zor akıl yürütme problemlerini çözebildiğimiz an, yapay zekâ ile matematikçiler arasında iş birliği potansiyelinin önünü açacak" dedi.
Her ne kadar etkileyici olsa da, bazı uzmanlar IMO sorularının zorlu olmasına rağmen, kavramsal olarak matematik araştırmalarının ön cephesindeki problemlere göre daha basit olduğunu hatırlatıyor. Bu başarı, yapay zekânın artan akıl yürütme yeteneklerini gösterse de, matematiksel araştırmanın tüm yönlerine hazır olduğu anlamına gelmiyor.