V dôležitom míľniku pre umelú inteligenciu preukázali spoločnosti OpenAI a Google DeepMind matematické schopnosti na úrovni zlatej medaily na Medzinárodnej matematickej olympiáde (IMO) 2025, najprestížnejšej súťaži pre mladých matematikov na svete.
Modely umelej inteligencie oboch spoločností získali zhodne 35 bodov zo 42 možných, keď dokonale vyriešili päť zo šiestich úloh. Tento výkon zodpovedal hranici pre zlatú medailu na tohtoročnej olympiáde, kde z približne 630 ľudských súťažiacich získalo zlatú medailu len asi 11 % (približne 67 študentov).
Pokročilá verzia modelu Gemini s modulom Deep Think od Google DeepMind bola oficiálne ohodnotená a certifikovaná koordinátormi IMO. Prezident IMO Gregor Dolinar poznamenal, že ich riešenia boli „v mnohých ohľadoch ohromujúce“ a „jasné, presné a väčšina z nich ľahko pochopiteľná“. Ide o výrazný pokrok oproti minulému roku, keď DeepMind získal striebornú medailu so špecializovanými systémami.
OpenAI testovalo svoj experimentálny model na rovnakých úlohách a za identických súťažných podmienok – počas dvoch 4,5-hodinových skúšok bez prístupu na internet alebo k nástrojom. Hoci OpenAI nebolo súčasťou oficiálneho hodnotenia IMO, spoločnosť nechala svoje riešenia nezávisle ohodnotiť tromi bývalými držiteľmi medailí IMO.
Načasovanie oznámení spôsobilo medzi spoločnosťami určité napätie. OpenAI zverejnilo svoje výsledky 19. júla, zatiaľ čo Google DeepMind čakal do 21. júla, aby rešpektoval žiadosť rady IMO o zverejnenie výsledkov až po oficiálnom overení a uznaní študentov.
Junehyuk Jung, profesor matematiky na Brownovej univerzite a hosťujúci výskumník v Google DeepMind, verí, že tento úspech naznačuje, že AI je menej než rok od toho, aby začala pomáhať matematikom riešiť nevyriešené výskumné problémy na hranici matematiky. „Myslím si, že moment, keď budeme vedieť riešiť zložité úlohy vyžadujúce logické uvažovanie v prirodzenom jazyku, umožní potenciál spolupráce medzi AI a matematikmi,“ povedal Jung pre agentúru Reuters.
Aj keď je tento úspech pôsobivý, niektorí odborníci upozorňujú, že úlohy IMO, hoci sú náročné, sú koncepčne jednoduchšie než výskumné problémy na hranici matematiky. Tento úspech demonštruje rastúce schopnosti AI v oblasti logického uvažovania, no neznamená automaticky pripravenosť na všetky aspekty matematického výskumu.