menu
close

OpenAI unifica gli strumenti di IA con ChatGPT Agent per compiti autonomi

Il 17 luglio 2025, OpenAI ha lanciato ChatGPT Agent, un sistema agentico unificato che combina le capacità di navigazione web di Operator, la forza analitica della deep research e l’intelligenza conversazionale di ChatGPT. Questo potente strumento consente agli utenti di delegare compiti complessi come l’analisi della concorrenza, la preparazione di riunioni e la pianificazione di viaggi, permettendo a ChatGPT di utilizzare un proprio computer virtuale per navigare sui siti, analizzare informazioni e produrre documenti modificabili. Sebbene sia ancora nelle fasi iniziali, questo lancio rappresenta lo sforzo più ambizioso di OpenAI per trasformare ChatGPT da semplice strumento di domande e risposte ad assistente digitale autonomo.
OpenAI unifica gli strumenti di IA con ChatGPT Agent per compiti autonomi

OpenAI ha compiuto un importante passo avanti nell’intelligenza artificiale con il lancio di ChatGPT Agent, un sistema in grado di portare a termine in modo indipendente compiti complessi dall’inizio alla fine utilizzando un proprio computer virtuale.

Il nuovo agente, annunciato il 17 luglio 2025, rappresenta un approccio unificato che combina tre capacità precedentemente separate: la possibilità di Operator di interagire con i siti web cliccando, scorrendo e digitando; l’abilità della deep research di sintetizzare informazioni provenienti dal web; e l’intelligenza conversazionale di ChatGPT. Questa integrazione supera i limiti degli strumenti precedenti, che funzionavano bene singolarmente ma non erano in grado di gestire flussi di lavoro completi.

Alimentato da GPT-4o, il modello multimodale di punta di OpenAI, ChatGPT Agent può gestire richieste sofisticate come "analizza tre concorrenti e crea una presentazione" oppure "guarda il mio calendario e aggiornami sui prossimi incontri con i clienti in base alle ultime notizie". Il sistema naviga sui siti sia in modo visivo che testuale, compila moduli, accede ad account autorizzati previa autorizzazione dell’utente, esegue codice e produce documenti modificabili, inclusi fogli di calcolo e presentazioni.

Nei test di riferimento, ChatGPT Agent supera significativamente gli strumenti precedenti di OpenAI. Nei compiti di modellazione per analisti di investment banking, supera sia la deep research sia il modello o3. Nel benchmark BrowseComp, dedicato al reperimento di informazioni difficili da trovare, ha raggiunto un nuovo record con il 68,9%, ovvero 17,4 punti percentuali in più rispetto alla deep research.

Pur essendo molto potente, OpenAI sottolinea che il controllo resta sempre nelle mani dell’utente. L’agente richiede il permesso prima di compiere azioni rilevanti e l’utente può interrompere, prendere il controllo del browser o fermare i compiti in qualsiasi momento. A partire da oggi, gli utenti Pro, Plus e Team possono attivare queste funzionalità dal menu degli strumenti selezionando la ‘modalità agente’ in qualsiasi conversazione.

Questo lancio rappresenta il tentativo più audace di OpenAI di trasformare ChatGPT da semplice strumento di domande e risposte a prodotto agentico capace di agire e sollevare gli utenti da compiti complessi. Sebbene i primi agenti di IA abbiano avuto difficoltà con compiti articolati, OpenAI afferma che ChatGPT Agent è molto più capace rispetto alle soluzioni precedenti, con piani di miglioramento costante per renderlo sempre più utile nel tempo.

Source:

Latest News