OpenAI направи значителен скок напред в изкуствения интелект с пускането на ChatGPT Agent – система, която може самостоятелно да изпълнява сложни задачи от начало до край, използвайки свой собствен виртуален компютър.
Новият агент, обявен на 17 юли 2025 г., представлява унифициран подход, който обединява три досега отделни възможности: способността на Operator да взаимодейства с уебсайтове чрез кликване, скролиране и писане; умението на deep research да синтезира информация от цялата мрежа; и разговорния интелект на ChatGPT. Тази интеграция преодолява ограниченията на по-старите инструменти, които работеха добре поотделно, но не можеха да управляват цялостни работни процеси.
Задвижван от GPT-4o, водещия мултимодален модел на OpenAI, ChatGPT Agent може да изпълнява сложни заявки като „анализирай трима конкуренти и създай презентация“ или „провери календара ми и ме информирай за предстоящи срещи с клиенти на база последните новини“. Системата навигира в уебсайтове както визуално, така и текстово, попълва формуляри, достъпва разрешени акаунти с позволение от потребителя, изпълнява код и създава редактиращи се документи, включително електронни таблици и презентации.
В бенчмарк тестове ChatGPT Agent значително превъзхожда предишните инструменти на OpenAI. При задачи по моделиране за анализатори в инвестиционното банкиране той надминава както deep research, така и модела o3. В теста BrowseComp за намиране на труднодостъпна информация постига ново най-високо постижение от 68,9%, което е с 17,4 процентни пункта повече от deep research.
Въпреки мощта си, OpenAI подчертава, че контролът остава в ръцете на потребителите. Агентът иска разрешение преди да предприеме важни действия, а потребителите могат да прекъснат, да поемат контрола над браузъра или да спрат задачите по всяко време. От днес потребителите на Pro, Plus и Team могат да активират тези възможности чрез падащото меню с инструменти, като изберат „agent mode“ във всеки разговор.
Това представяне бележи най-смелия опит на OpenAI досега да превърне ChatGPT от инструмент за въпроси и отговори в агентен продукт, който може да извършва действия и да поема сложни задачи вместо потребителите. Докато ранните AI агенти срещаха трудности със сложни задачи, OpenAI твърди, че ChatGPT Agent е значително по-способен от предишните решения, като планира редовни подобрения, за да го направи все по-полезен с времето.