menu
close

OpenAI förenar AI-verktyg med ChatGPT Agent för autonoma uppgifter

Den 17 juli 2025 lanserade OpenAI ChatGPT Agent, ett enhetligt agent-system som kombinerar webbnavigeringsförmågan hos Operator, de analytiska styrkorna från deep research och ChatGPT:s konverserande intelligens. Detta kraftfulla verktyg gör det möjligt för användare att överlåta komplexa uppgifter som konkurrentanalys, mötesförberedelser och reseplanering genom att låta ChatGPT använda sin egen virtuella dator för att navigera på webbplatser, analysera information och leverera redigerbara dokument. Även om verktyget fortfarande är i ett tidigt skede, representerar lanseringen OpenAIs mest ambitiösa försök hittills att omvandla ChatGPT från ett frågesvarsverktyg till en autonom digital assistent.
OpenAI förenar AI-verktyg med ChatGPT Agent för autonoma uppgifter

OpenAI har tagit ett betydande steg framåt inom artificiell intelligens med lanseringen av ChatGPT Agent, ett system som självständigt kan slutföra komplexa uppgifter från början till slut med hjälp av sin egen virtuella dator.

Den nya agenten, som presenterades den 17 juli 2025, representerar en enhetlig strategi som kombinerar tre tidigare separata funktioner: Operators förmåga att interagera med webbplatser genom att klicka, scrolla och skriva; deep researchs skicklighet i att syntetisera information från hela webben; samt ChatGPT:s konverserande intelligens. Denna integration adresserar begränsningar hos tidigare verktyg som fungerade bra var för sig men inte kunde hantera arbetsflöden från början till slut.

Drivet av GPT-4o, OpenAIs flaggskeppsmodell för multimodal AI, kan ChatGPT Agent hantera sofistikerade förfrågningar som "analysera tre konkurrenter och skapa en presentation" eller "titta på min kalender och briefa mig om kommande kundmöten baserat på senaste nyheter". Systemet navigerar på webbplatser både visuellt och textuellt, fyller i formulär, får tillgång till auktoriserade konton med användarens tillstånd, exekverar kod och skapar redigerbara dokument, inklusive kalkylblad och presentationer.

I benchmark-tester presterar ChatGPT Agent avsevärt bättre än tidigare OpenAI-verktyg. På investeringsbankernas analytikermodelleringsuppgifter överträffar den både deep research och o3-modellen. På BrowseComp-benchmarken för att hitta svåråtkomlig information nådde den ett nytt toppresultat på 68,9 %, vilket är 17,4 procentenheter högre än deep research.

Trots sin kraftfullhet betonar OpenAI att användaren alltid har kontrollen. Agenten begär tillstånd innan den utför betydelsefulla åtgärder, och användaren kan när som helst avbryta, ta över webbläsaren eller stoppa uppgifter. Från och med idag kan Pro-, Plus- och Team-användare aktivera dessa funktioner via verktygsmenyn genom att välja 'agentläge' i valfri konversation.

Denna lansering markerar OpenAIs djärvaste försök hittills att omvandla ChatGPT från ett frågesvarsverktyg till en agentprodukt som kan agera och avlasta användare från komplexa uppgifter. Även om tidiga AI-agenter haft svårt med avancerade uppgifter, hävdar OpenAI att ChatGPT Agent är betydligt mer kapabel än tidigare lösningar, med planer på regelbundna förbättringar för att göra den allt mer användbar över tid.

Source:

Latest News