OpenAI가 ChatGPT 에이전트 출시를 통해 인공지능 분야에서 한 단계 도약했다. 이 시스템은 자체 가상 컴퓨터를 활용해 복잡한 업무를 처음부터 끝까지 독립적으로 수행할 수 있다.
2025년 7월 17일 공개된 새로운 에이전트는 기존에 분리되어 있던 세 가지 기능을 통합했다. Operator의 웹사이트 클릭, 스크롤, 입력 등 상호작용 기능, 웹 전반에서 정보를 종합하는 심층 분석 능력, 그리고 ChatGPT의 대화형 지능이 하나로 합쳐졌다. 이 통합은 개별적으로는 뛰어나지만, 전체적인 업무 흐름을 처리하지 못했던 기존 도구들의 한계를 극복한다.
OpenAI의 대표 멀티모달 모델인 GPT-4o로 구동되는 ChatGPT 에이전트는 "세 경쟁사를 분석해 슬라이드 자료를 만들어줘" 또는 "내 캘린더를 확인하고 최근 뉴스 기반으로 다가오는 고객 미팅을 요약해줘"와 같은 복잡한 요청도 처리할 수 있다. 이 시스템은 웹사이트를 시각적·텍스트적으로 탐색하고, 양식을 작성하며, 사용자의 허가 하에 계정에 접근하고, 코드를 실행하며, 스프레드시트와 프레젠테이션 등 편집 가능한 문서를 생성한다.
벤치마크 테스트 결과, ChatGPT 에이전트는 기존 OpenAI 도구를 크게 능가했다. 투자은행 애널리스트 모델링 업무에서는 심층 분석 및 o3 모델을 모두 앞섰고, 찾기 어려운 정보를 탐색하는 BrowseComp 벤치마크에서는 68.9%라는 새로운 최고 점수를 기록해 심층 분석 대비 17.4%p 높은 성과를 보였다.
OpenAI는 강력한 기능에도 불구하고 사용자가 항상 통제권을 가진다고 강조한다. 에이전트는 중요한 조치를 취하기 전 반드시 허가를 요청하며, 사용자는 언제든지 중단하거나 브라우저를 직접 조작하거나 업무를 멈출 수 있다. 오늘부터 Pro, Plus, Team 사용자는 도구 드롭다운에서 '에이전트 모드'를 선택해 해당 기능을 활성화할 수 있다.
이번 출시는 ChatGPT를 단순 질의응답 도구에서 사용자를 대신해 복잡한 업무를 처리하는 에이전트형 제품으로 탈바꿈시키려는 OpenAI의 가장 대담한 시도로 평가된다. 초기 AI 에이전트들이 복잡한 업무에서 한계를 보였던 반면, OpenAI는 ChatGPT 에이전트가 이전 제품보다 훨씬 뛰어난 역량을 갖췄으며, 앞으로도 지속적인 개선을 통해 점점 더 유용한 도구로 발전시킬 계획이라고 밝혔다.