V zásadním milníku pro oblast umělé inteligence předvedly společnosti OpenAI a Google DeepMind matematické uvažování na úrovni zlaté medaile na Mezinárodní matematické olympiádě 2025 (IMO), nejprestižnější soutěži pro mladé matematiky na světě.
Modely obou firem dosáhly shodného skóre 35 bodů ze 42 možných, když bezchybně vyřešily pět ze šesti úloh. Tento výkon odpovídá hranici pro zlatou medaili v letošním ročníku, kde zhruba jen 11 % z 630 lidských soutěžících (přibližně 67 studentů) získalo zlatou medaili.
Pokročilá verze modelu Gemini s modulem Deep Think od Google DeepMind byla oficiálně ohodnocena a certifikována koordinátory IMO. Prezident IMO Gregor Dolinar uvedl, že jejich řešení byla „v mnoha ohledech ohromující“ a „jasná, přesná a většinou snadno sledovatelná“. Jde o výrazný pokrok oproti loňsku, kdy DeepMind získal stříbrnou medaili se specializovanými systémy.
OpenAI otestovala svůj experimentální model pro uvažování na stejných úlohách za identických soutěžních podmínek – během dvou 4,5hodinových zkoušek bez přístupu k internetu či nástrojům. Přestože OpenAI nebyla součástí oficiálního hodnoticího procesu IMO, nechala svá řešení nezávisle ohodnotit třemi bývalými držiteli medailí z IMO.
Načasování oznámení vyvolalo mezi firmami určité napětí. OpenAI zveřejnila své výsledky 19. července, zatímco Google DeepMind vyčkal do 21. července, aby vyhověl žádosti rady IMO a sdílel výsledky až po oficiálním ověření a uznání studentů.
Junehyuk Jung, profesor matematiky na Brownově univerzitě a hostující výzkumník v Google DeepMind, věří, že tento úspěch naznačuje, že AI je méně než rok od toho, aby začala pomáhat matematikům s řešením nevyřešených výzkumných problémů na hranici poznání. „Myslím, že moment, kdy budeme schopni řešit složité úlohy vyžadující uvažování v přirozeném jazyce, umožní spolupráci mezi AI a matematiky,“ řekl Jung agentuře Reuters.
Ačkoliv je tento výkon působivý, někteří odborníci upozorňují, že úlohy z IMO jsou sice obtížné, ale koncepčně jednodušší než špičkový výzkum v matematice. Výsledek demonstruje rostoucí schopnosti AI v oblasti uvažování, ale neznamená nutně připravenost na všechny aspekty matematického výzkumu.