Harmonic, en AI-startup medstiftet af Robinhoods direktør Vlad Tenev, har udgivet beta-versionen af sin iOS- og Android-chatbot-app med Aristotle – en AI-model, der er udviklet specifikt til matematiske ræsonnementer uden hallucinationer.
Virksomheden, der for nylig har rejst 100 millioner dollars i Series B-finansiering til en værdiansættelse på 875 millioner dollars, adskiller sig fra traditionelle AI-modeller ved at fokusere på matematisk superintelligens (MSI). I modsætning til konventionelle store sprogmodeller, som ofte har svært ved komplekse beregninger, er Aristotle bygget fra bunden med det formål at garantere nøjagtighed inden for kvantitative områder.
"Aristotle er det første produkt tilgængeligt for folk, der både ræsonnerer og formelt verificerer outputtet," udtaler Harmonics direktør og medstifter Tudor Achim. "Inden for de områder, som Aristotle understøtter – altså kvantitative ræsonnementer – garanterer vi faktisk, at der ikke forekommer hallucinationer."
Systemet opnår denne bemærkelsesværdige nøjagtighed gennem en totrinsproces. Først oversætter Aristotle matematiske problemer fra naturligt sprog til det open source-baserede programmeringssprog Lean 4, en bevisassistent, der muliggør kontrol af matematiske definitioner og sætninger for korrekthed. Dernæst dobbelttjekker modellen løsningerne gennem en algoritmisk verifikationsproces, der ikke involverer AI – på linje med de verifikationsmetoder, der benyttes i højsikkerhedsbrancher som medicinsk udstyr og luftfart.
Harmonic hævder, at Aristotle opnåede guldmedaljepræstation ved den Internationale Matematikolympiade 2025 gennem formel testning, hvor opgaver blev oversat til maskinlæsbare formater. Denne præstation kommer i et år, hvor AI-modeller fra både Google DeepMind og OpenAI også nåede guldmedaljeniveau ved IMO, dog gennem uformelle tests udført på naturligt sprog.
Virksomhedens ambitioner rækker ud over matematikken. Harmonic mener, at MSI vil hjælpe brugere inden for alle områder, der kræver matematisk ræsonnement – herunder fysik, statistik og datalogi. På sigt planlægger virksomheden at lancere et API til erhvervslivet og en webapplikation til forbrugere, hvilket potentielt kan ændre måden, industrier tackler problemer, der kræver præcis kvantitativ ræsonnement.