Dalam sebuah tonggak penting bagi kecerdasan buatan, OpenAI mengumumkan bahwa model penalaran eksperimental terbarunya telah meraih performa setara medali emas pada International Mathematical Olympiad (IMO) 2025, yang secara luas dianggap sebagai kompetisi matematika paling bergengsi di dunia.
Model ini berhasil menyelesaikan lima dari enam soal IMO 2025, memperoleh 35 dari 42 poin maksimal—setara dengan pencapaian medali emas. Yang membuat pencapaian ini sangat luar biasa adalah AI tersebut bekerja di bawah kondisi ketat yang sama seperti peserta manusia: dua sesi ujian masing-masing 4,5 jam tanpa akses ke alat bantu, internet, atau bantuan eksternal.
"Ini merepresentasikan tingkat pemikiran kreatif berkelanjutan yang baru dibandingkan tolok ukur sebelumnya," ujar Alexander Wei, peneliti OpenAI yang mengumumkan terobosan ini. Wei mencatat bahwa cakupan waktu penalaran telah berkembang dari soal matematika sederhana yang dapat diselesaikan manusia terbaik dalam sekitar 0,1 menit, menjadi soal IMO yang membutuhkan sekitar 100 menit konsentrasi penuh.
Berbeda dengan sistem AI sebelumnya yang dirancang khusus untuk kompetisi matematika, model OpenAI ini adalah model bahasa penalaran serba guna yang menggabungkan teknik eksperimental baru dalam reinforcement learning dan peningkatan komputasi saat pengujian. Tiga mantan peraih medali IMO secara independen menilai bukti-bukti yang diajukan model, dengan skor akhir ditetapkan setelah konsensus bulat.
Pencapaian ini semakin menonjol jika dibandingkan dengan model AI terdepan lainnya. Dalam evaluasi terbaru oleh MathArena.ai, para pesaing seperti Gemini 2.5 Pro, Grok-4, dan model o3 OpenAI sebelumnya semuanya gagal mencapai ambang medali perunggu pada soal yang sama.
Waktu terobosan ini bertepatan dengan rencana peluncuran GPT-5 oleh OpenAI dalam beberapa bulan mendatang. Menurut berbagai sumber, GPT-5 akan menyatukan beragam model khusus OpenAI—termasuk kemampuan penalaran yang ditunjukkan dalam pencapaian IMO ini—ke dalam satu sistem dengan router pintar yang secara otomatis memilih pendekatan paling tepat untuk setiap tugas.
"LLM IMO gold adalah model riset eksperimental. Kami tidak berencana merilis apa pun dengan kemampuan matematika setingkat ini dalam beberapa bulan ke depan," jelas Wei, mengisyaratkan bahwa kemampuan penalaran tingkat lanjut ini mungkin akan diintegrasikan dalam rilis publik di masa mendatang.