OpenAI har presenterat ChatGPT Agent, ett banbrytande framsteg som förvandlar den populära AI:n från en konversationell assistent till en autonom digital kollega som självständigt kan slutföra komplexa uppgifter.
Det nya systemet gör det möjligt för ChatGPT att tänka och agera proaktivt, och hantera komplexa uppgifter från början till slut med hjälp av sin egen virtuella dator. Användare kan nu be ChatGPT utföra en mängd olika datorbaserade uppgifter, från att hantera kalendrar och skapa redigerbara presentationer till att köra kod.
Det som särskiljer ChatGPT Agent är dess enhetliga tillvägagångssätt för AI-förmågor. Tidigare erbjöd OpenAI separata verktyg med olika styrkor: Operator kunde scrolla, klicka och skriva på webbplatser men saknade förmåga till djupanalys, medan Deep Research utmärkte sig på att analysera och sammanfatta information men kunde inte interagera med webbplatser som krävde autentisering. Genom att integrera dessa kompletterande styrkor och införa ytterligare verktyg har OpenAI låst upp helt nya möjligheter inom en och samma modell.
Säkerhet är ett centralt fokus i det nya systemet. OpenAI har lagt särskild vikt vid att skydda ChatGPT Agent mot fientlig manipulation via promptinjektion, vilket är en risk för agentbaserade system där tredje part försöker manipulera beteendet genom illvilliga instruktioner som AI:n stöter på på webben. Företaget har tränat och testat agenten för att identifiera och stå emot promptinjektioner, infört övervakning för att snabbt upptäcka och hantera attacker, samt kräver uttryckligt användargodkännande innan betydande åtgärder vidtas. Resultat innehåller tydligt märkta källhänvisningar eller skärmdumpscitat så att användare kan verifiera informationen. Ytterligare sekretesskontroller gör det möjligt för användare att radera all webbhistorik och omedelbart logga ut från alla aktiva webbplatssessioner med ett enda klick. När användare interagerar med webben via ChatGPT:s webbläsare i "takeover-läge" förblir inmatningar privata, och ChatGPT samlar inte in eller lagrar känslig data som lösenord.
Trots dessa framsteg är ChatGPT Agent fortfarande i ett tidigt skede. Även om den kan hantera en rad komplexa uppgifter kan den fortfarande göra misstag. Den nya Agent-funktionen är för närvarande tillgänglig för användare av ChatGPT Plus, Pro och Team, vilket gör det möjligt för AI:n att utföra verkliga uppgifter med hjälp av en virtuell dator direkt i webbläsaren.
Denna lansering markerar ett avgörande ögonblick för AI:s integration i professionella arbetsflöden. Den senaste utvecklingen inom artificiell intelligens går bortom enbart konversation och inleder en era där digitala assistenter aktivt kan utföra uppgifter över det digitala landskapet. Denna utveckling signalerar ett betydande skifte, där AI rör sig från tolkande förståelse till direkt, handlingskraftig interaktion med de verktyg och gränssnitt som människor använder dagligen. Lanseringen innebär ett skifte i hur användare interagerar med AI – från att ställa frågor till att tilldela kompletta uppgifter. Med förmågan att resonera, agera och leverera resultat satsar OpenAI på att användare i allt högre grad vill att AI inte bara ska assistera dem, utan arbeta för dem.