OpenAI wykonało znaczący krok naprzód w dziedzinie sztucznej inteligencji, wprowadzając ChatGPT Agent — system zdolny do samodzielnego realizowania złożonych zadań od początku do końca, korzystając z własnego wirtualnego komputera.
Nowy agent, ogłoszony 17 lipca 2025 roku, reprezentuje zunifikowane podejście, które łączy trzy wcześniej odrębne możliwości: umiejętność Operatora do interakcji ze stronami internetowymi poprzez klikanie, przewijanie i wpisywanie danych; zdolność deep research do syntezowania informacji z całej sieci; oraz konwersacyjną inteligencję ChatGPT. Ta integracja rozwiązuje ograniczenia wcześniejszych narzędzi, które dobrze sprawdzały się osobno, ale nie radziły sobie z obsługą zadań od początku do końca.
Napędzany przez GPT-4o, flagowy multimodalny model OpenAI, ChatGPT Agent potrafi realizować zaawansowane polecenia, takie jak „przeanalizuj trzech konkurentów i stwórz prezentację” czy „sprawdź mój kalendarz i przygotuj podsumowanie nadchodzących spotkań z klientami na podstawie najnowszych wiadomości”. System nawigując po stronach zarówno wizualnie, jak i tekstowo, wypełnia formularze, uzyskuje dostęp do autoryzowanych kont za zgodą użytkownika, wykonuje kod oraz tworzy edytowalne dokumenty — w tym arkusze kalkulacyjne i prezentacje.
W testach porównawczych ChatGPT Agent znacząco przewyższa wcześniejsze narzędzia OpenAI. W zadaniach modelowania analityków bankowości inwestycyjnej przewyższa zarówno deep research, jak i model o3. W teście BrowseComp, oceniającym zdolność odnajdywania trudno dostępnych informacji, osiągnął nowy rekord — 68,9%, czyli o 17,4 punktu procentowego więcej niż deep research.
Mimo swojej mocy, OpenAI podkreśla, że użytkownik zachowuje pełną kontrolę. Agent prosi o zgodę przed wykonaniem istotnych działań, a użytkownik w każdej chwili może przerwać, przejąć kontrolę nad przeglądarką lub zatrzymać zadanie. Od dziś użytkownicy Pro, Plus i Team mogą aktywować te możliwości poprzez menu narzędzi, wybierając w dowolnej rozmowie tryb „agent mode”.
Ta premiera to najodważniejsza dotąd próba OpenAI, by przekształcić ChatGPT z narzędzia do odpowiadania na pytania w produkt agentowy, zdolny do podejmowania działań i przejmowania złożonych zadań od użytkowników. Choć wcześniejsze agenty AI miały trudności z realizacją skomplikowanych zadań, OpenAI twierdzi, że ChatGPT Agent jest znacznie bardziej zaawansowany niż dotychczasowe rozwiązania, a regularne aktualizacje mają uczynić go z czasem coraz bardziej użytecznym.