De race naar artificiële algemene intelligentie (AGI) heeft een cruciaal moment bereikt nu het o3-model van OpenAI capaciteiten laat zien die tot voor kort als onmogelijk werden beschouwd.
Zach Vorhies, de voormalige Google-klokkenluider die in 2019 bekendheid verwierf na het onthullen van wat hij omschreef als het censuurregime van Google, is inmiddels een uitgesproken voorstander van het versnellen in plaats van vertragen van AI-ontwikkeling. In recente interviews verwerpt Vorhies krachtig het idee dat de vooruitgang in AI afvlakt, waarbij hij het o3-model van OpenAI aanhaalt als doorslaggevend bewijs van versnelde ontwikkeling.
Het o3-systeem heeft volgens veel experts een doorbraak bereikt, met een score van 75,7% op de ARC-AGI-benchmark onder standaard rekenkracht en zelfs 87,5% met meer computerbronnen. Deze prestaties overtreffen het gemiddelde menselijke resultaat van 80% op deze abstracte redeneertaken, die specifiek zijn ontworpen om algemene intelligentie te testen. François Chollet, bedenker van de ARC Challenge, erkende dat dit een 'verrassende en belangrijke sprong in AI-capaciteiten' betekent.
Sam Altman, CEO van OpenAI, verklaarde publiekelijk: 'We zijn er nu van overtuigd dat we weten hoe we AGI kunnen bouwen zoals we dat traditioneel begrepen hebben,' en voorspelde dat 'in 2025 de eerste AI-agenten de arbeidsmarkt kunnen betreden en de output van bedrijven wezenlijk zullen veranderen.' Deze tijdlijn sluit aan bij voorspellingen van andere kopstukken uit de sector, waaronder Elon Musk en Dario Amodei van Anthropic, die suggereren dat AI-systemen de menselijke intelligentie al in 2026 kunnen overtreffen.
Vorhies schetst een toekomst waarin AI-agenten werkprocessen transformeren, waarbij ze zich opsplitsen in 'architecten' die doelen op hoog niveau bepalen en 'uitvoerders' die specifieke taken uitvoeren. Hoewel dit de efficiëntie in sectoren drastisch kan verhogen, waarschuwt hij ook voor aanzienlijke baanverliezen.
Ondanks de opwinding waarschuwen experts dat o3 nog steeds faalt op sommige eenvoudige taken en enorme rekenkracht vereist. De aankomende ARC-AGI-2-benchmark, die in 2025 wordt gelanceerd, zal naar verwachting aanzienlijk grotere uitdagingen bieden, waardoor de prestaties van o3 mogelijk onder de 30% zakken terwijl mensen deze taken wel kunnen oplossen. Zoals Chollet opmerkt: 'Je weet dat AGI er is als het creëren van taken die makkelijk zijn voor gewone mensen, maar moeilijk voor AI, simpelweg onmogelijk wordt.'