Dalam satu pencapaian penting bagi kecerdasan buatan, kedua-dua OpenAI dan Google DeepMind telah membuktikan keupayaan penaakulan matematik bertaraf pingat emas di Olimpik Matematik Antarabangsa (IMO) 2025, pertandingan paling berprestij di dunia untuk ahli matematik muda.
Model AI daripada kedua-dua syarikat itu memperoleh markah yang sama iaitu 35 daripada 42 mata maksimum, dengan berjaya menyelesaikan lima daripada enam soalan dengan sempurna. Prestasi ini menyamai ambang pingat emas pada pertandingan tahun ini, di mana hanya sekitar 11% daripada 630 peserta manusia (kira-kira 67 pelajar) menerima pingat emas.
Versi lanjutan Gemini dengan Deep Think daripada Google DeepMind telah dinilai dan disahkan secara rasmi oleh penyelaras IMO, dengan Presiden IMO, Gregor Dolinar, menyatakan bahawa penyelesaian mereka "mengagumkan dalam banyak aspek" serta "jelas, tepat dan kebanyakannya mudah diikuti." Ini merupakan kemajuan besar berbanding tahun lalu, apabila DeepMind hanya meraih pingat perak menggunakan sistem khusus.
OpenAI pula menilai model penaakulan eksperimennya pada soalan yang sama di bawah syarat pertandingan yang setara—dua sesi peperiksaan selama 4.5 jam tanpa akses internet atau alat bantuan. Walaupun OpenAI tidak terlibat dalam proses penilaian rasmi IMO, syarikat itu telah mendapatkan penilaian bebas daripada tiga bekas pemenang pingat IMO.
Pengumuman hasil pencapaian ini menyebabkan sedikit ketegangan antara kedua-dua syarikat. OpenAI menerbitkan keputusannya pada 19 Julai, manakala Google DeepMind menunggu sehingga 21 Julai, mematuhi permintaan Lembaga IMO untuk berkongsi keputusan selepas pengesahan rasmi dan pengiktirafan pelajar.
Junehyuk Jung, profesor matematik di Universiti Brown dan penyelidik pelawat di Google DeepMind, percaya pencapaian ini menunjukkan AI kurang daripada setahun lagi untuk membantu ahli matematik menangani masalah penyelidikan yang belum terjawab di hadapan bidang matematik. "Saya rasa saat kita dapat menyelesaikan masalah penaakulan sukar dalam bahasa semula jadi akan membolehkan potensi kerjasama antara AI dan ahli matematik," kata Jung kepada Reuters.
Walaupun mengagumkan, beberapa pakar memberi amaran bahawa soalan IMO, walaupun sukar, adalah lebih mudah secara konsep berbanding matematik penyelidikan hadapan. Pencapaian ini menunjukkan keupayaan penaakulan AI yang semakin berkembang tetapi tidak semestinya menandakan kesediaan untuk semua aspek penyelidikan matematik.