OpenAI har tagit ett betydande steg framåt inom artificiell intelligens med lanseringen av ChatGPT Agent, ett system som självständigt kan slutföra komplexa uppgifter från början till slut med hjälp av sin egen virtuella dator.
Den nya agenten, som presenterades den 17 juli 2025, representerar en enhetlig strategi som kombinerar tre tidigare separata funktioner: Operators förmåga att interagera med webbplatser genom att klicka, scrolla och skriva; deep researchs skicklighet i att syntetisera information från hela webben; samt ChatGPT:s konverserande intelligens. Denna integration adresserar begränsningar hos tidigare verktyg som fungerade bra var för sig men inte kunde hantera arbetsflöden från början till slut.
Drivet av GPT-4o, OpenAIs flaggskeppsmodell för multimodal AI, kan ChatGPT Agent hantera sofistikerade förfrågningar som "analysera tre konkurrenter och skapa en presentation" eller "titta på min kalender och briefa mig om kommande kundmöten baserat på senaste nyheter". Systemet navigerar på webbplatser både visuellt och textuellt, fyller i formulär, får tillgång till auktoriserade konton med användarens tillstånd, exekverar kod och skapar redigerbara dokument, inklusive kalkylblad och presentationer.
I benchmark-tester presterar ChatGPT Agent avsevärt bättre än tidigare OpenAI-verktyg. På investeringsbankernas analytikermodelleringsuppgifter överträffar den både deep research och o3-modellen. På BrowseComp-benchmarken för att hitta svåråtkomlig information nådde den ett nytt toppresultat på 68,9 %, vilket är 17,4 procentenheter högre än deep research.
Trots sin kraftfullhet betonar OpenAI att användaren alltid har kontrollen. Agenten begär tillstånd innan den utför betydelsefulla åtgärder, och användaren kan när som helst avbryta, ta över webbläsaren eller stoppa uppgifter. Från och med idag kan Pro-, Plus- och Team-användare aktivera dessa funktioner via verktygsmenyn genom att välja 'agentläge' i valfri konversation.
Denna lansering markerar OpenAIs djärvaste försök hittills att omvandla ChatGPT från ett frågesvarsverktyg till en agentprodukt som kan agera och avlasta användare från komplexa uppgifter. Även om tidiga AI-agenter haft svårt med avancerade uppgifter, hävdar OpenAI att ChatGPT Agent är betydligt mer kapabel än tidigare lösningar, med planer på regelbundna förbättringar för att göra den allt mer användbar över tid.