Das Rennen um die künstliche allgemeine Intelligenz (AGI) hat mit dem o3-Modell von OpenAI einen entscheidenden Wendepunkt erreicht: Es demonstriert Fähigkeiten, die noch vor wenigen Monaten als unmöglich galten.
Zach Vorhies, der ehemalige Google-Whistleblower, der 2019 durch die Enthüllung dessen, was er als Zensurregime von Google bezeichnete, bekannt wurde, tritt inzwischen als engagierter Befürworter einer beschleunigten KI-Entwicklung auf. In aktuellen Interviews widerspricht Vorhies entschieden der These, dass der Fortschritt bei KI stagniere, und nennt das o3-Modell von OpenAI als eindeutigen Beweis für die zunehmende Beschleunigung.
Das o3-System hat laut Experten einen Durchbruch erzielt: Es erreichte 75,7 % im ARC-AGI-Benchmark unter Standard-Bedingungen und sogar 87,5 % mit höherer Rechenleistung. Damit übertrifft es den durchschnittlichen menschlichen Wert von 80 % bei diesen Aufgaben zum abstrakten Denken, die speziell zur Prüfung allgemeiner Intelligenz entwickelt wurden. François Chollet, der Schöpfer der ARC Challenge, bezeichnete dies als einen 'überraschenden und wichtigen Sprung in den Fähigkeiten von KI-Systemen.'
Sam Altman, CEO von OpenAI, erklärte öffentlich: 'Wir sind jetzt zuversichtlich, dass wir wissen, wie man AGI im traditionellen Sinne baut', und prognostizierte: '2025 könnten die ersten KI-Agenten in die Arbeitswelt eintreten und die Produktivität von Unternehmen grundlegend verändern.' Dieser Zeitrahmen deckt sich mit Vorhersagen anderer Branchenführer wie Elon Musk und Dario Amodei von Anthropic, die davon ausgehen, dass KI-Systeme bis 2026 die menschliche Intelligenz übertreffen könnten.
Vorhies entwirft eine Zukunft, in der KI-Agenten Arbeitsprozesse revolutionieren, indem sie sich in 'Architekten' aufteilen, die Ziele festlegen, und 'Umsetzer', die konkrete Aufgaben ausführen. Dies könnte die Effizienz in vielen Branchen drastisch steigern, birgt jedoch auch das Risiko erheblicher Arbeitsplatzverluste.
Trotz aller Euphorie warnen Experten, dass o3 bei manchen einfachen Aufgaben noch scheitert und enorme Rechenressourcen benötigt. Der kommende ARC-AGI-2-Benchmark, der 2025 startet, soll deutlich anspruchsvoller werden und könnte die Leistung von o3 auf unter 30 % drücken, während Menschen die Aufgaben weiterhin lösen können. Wie Chollet betont: 'Man wird wissen, dass AGI erreicht ist, wenn es unmöglich wird, Aufgaben zu erstellen, die für normale Menschen einfach, für KI aber schwer sind.'