Yapay zekâ alanında önemli bir dönüm noktası olarak kabul edilen bu gelişmede, OpenAI son deneysel akıl yürütme modelinin dünyanın en prestijli matematik yarışması olan 2025 Uluslararası Matematik Olimpiyatı'nda (IMO) altın madalya seviyesinde performans gösterdiğini duyurdu.
Model, 2025 IMO'daki 6 sorudan 5'ini başarıyla çözerek 42 üzerinden 35 puan aldı ve bu da altın madalya performansına eşdeğer. Bu başarıyı özellikle dikkat çekici kılan unsur ise, yapay zekânın insan yarışmacılarla aynı sıkı koşullarda çalışmasıydı: İki adet 4,5 saatlik sınav oturumu, hiçbir araç, internet veya dış yardım olmadan.
"Bu, önceki ölçütlerle karşılaştırıldığında sürekli yaratıcı düşünmede yeni bir seviyeyi temsil ediyor," diyen OpenAI araştırmacısı Alexander Wei, bu atılımı duyurdu. Wei, akıl yürütme zaman ufkunun, en iyi insanların yaklaşık 0,1 dakikada çözebildiği basit matematik problemlerinden, yaklaşık 100 dakika yoğun çaba gerektiren IMO sorularına kadar ilerlediğini belirtti.
Daha önce matematik yarışmaları için özel olarak tasarlanmış yapay zekâ sistemlerinden farklı olarak, OpenAI'nin modeli genel amaçlı bir akıl yürütme dil modeli olup, pekiştirmeli öğrenme ve sınav anında hesaplama ölçeklendirmesi gibi yeni deneysel teknikleri bünyesinde barındırıyor. Modelin sunduğu çözümler, üç eski IMO madalyalısı tarafından bağımsız olarak değerlendirildi ve puanlar oybirliğiyle kesinleştirildi.
Bu başarı, diğer önde gelen yapay zekâ modelleriyle karşılaştırıldığında özellikle dikkat çekici. MathArena.ai tarafından yapılan son bir değerlendirmede, Gemini 2.5 Pro, Grok-4 ve OpenAI'nin önceki o3 modeli de dahil olmak üzere rakiplerin hiçbiri aynı sorularda bronz madalya eşiğine dahi ulaşamadı.
Bu atılımın zamanlaması, OpenAI'nin önümüzdeki aylarda piyasaya sürmesi beklenen GPT-5 ile örtüşüyor. Birden fazla kaynağa göre, GPT-5; bu IMO başarısında gösterilen akıl yürütme yetenekleri de dahil olmak üzere, OpenAI'nin çeşitli uzmanlaşmış modellerini tek bir sistemde birleştirecek ve her görev için en uygun yaklaşımı otomatik olarak seçen akıllı bir yönlendiriciye sahip olacak.
"IMO altın LLM'i deneysel bir araştırma modelidir. Bu seviyede matematik yeteneğine sahip bir şeyi birkaç ay boyunca piyasaya sürmeyi planlamıyoruz," diyen Wei, bu gelişmiş akıl yürütme yeteneklerinin gelecekteki halka açık sürümlere entegre edilebileceğini ima etti.