menu
close

Pinag-isa ng OpenAI ang mga AI Tool sa Pamamagitan ng ChatGPT Agent para sa Awtonomong mga Gawain

Noong Hulyo 17, 2025, inilunsad ng OpenAI ang ChatGPT Agent, isang pinag-isang agentic system na pinagsasama ang kakayahan ng Operator sa pag-navigate sa web, ang lakas ng malalim na pananaliksik, at ang katalinuhan sa pakikipag-usap ng ChatGPT. Binibigyang-daan ng makapangyarihang tool na ito ang mga user na ipasa ang mga komplikadong gawain tulad ng pagsusuri ng mga kakumpitensya, paghahanda para sa mga pagpupulong, at pagpaplano ng biyahe sa ChatGPT, na gumagamit ng sarili nitong virtual na computer upang mag-navigate sa mga website, magsuri ng impormasyon, at maghatid ng mga dokumentong maaaring i-edit. Bagama't nasa maagang yugto pa, ang paglulunsad na ito ang pinaka-ambisyosong hakbang ng OpenAI upang gawing isang awtonomong digital assistant ang ChatGPT mula sa pagiging simpleng kasangkapan sa pagsagot ng tanong.
Pinag-isa ng OpenAI ang mga AI Tool sa Pamamagitan ng ChatGPT Agent para sa Awtonomong mga Gawain

Isang malaking hakbang pasulong sa larangan ng artificial intelligence ang ginawa ng OpenAI sa paglulunsad ng ChatGPT Agent, isang sistemang kayang tapusin nang mag-isa ang mga komplikadong gawain mula simula hanggang wakas gamit ang sarili nitong virtual na computer.

Ang bagong agent, na inanunsyo noong Hulyo 17, 2025, ay kumakatawan sa isang pinag-isang approach na pinagsasama ang tatlong dating magkakahiwalay na kakayahan: ang kakayahan ng Operator na makipag-interact sa mga website sa pamamagitan ng pag-click, pag-scroll, at pag-type; ang kasanayan ng deep research sa pagsasama-sama ng impormasyon mula sa buong web; at ang katalinuhan sa pakikipag-usap ng ChatGPT. Nilulutas ng integrasyong ito ang mga limitasyon ng mga naunang tool na mahusay lamang kapag magkakahiwalay ngunit hindi kayang pamahalaan ang end-to-end na mga workflow.

Pinapagana ng GPT-4o, ang pangunahing multimodal na modelo ng OpenAI, kayang tugunan ng ChatGPT Agent ang mga masalimuot na kahilingan gaya ng "suriin ang tatlong kakumpitensya at gumawa ng slide deck" o "tingnan ang aking kalendaryo at bigyan ako ng buod ng mga paparating na client meeting batay sa mga pinakabagong balita." Kayang mag-navigate ng sistema sa mga website gamit ang visual at tekstuwal na paraan, magkumpleto ng mga form, mag-access ng mga awtorisadong account sa pahintulot ng user, magpatupad ng code, at gumawa ng mga dokumentong maaaring i-edit tulad ng spreadsheet at presentasyon.

Sa mga benchmark test, malaki ang naging pag-angat ng ChatGPT Agent kumpara sa mga naunang tool ng OpenAI. Sa mga gawain ng investment banking analyst modeling, nalampasan nito ang deep research at ang o3 model. Sa BrowseComp benchmark para sa paghahanap ng mahirap hanaping impormasyon, nakamit nito ang bagong pinakamataas na score na 68.9%, na 17.4 percentage points na mas mataas kaysa sa deep research.

Bagama't makapangyarihan, binibigyang-diin ng OpenAI na nananatiling may kontrol ang mga user. Humihingi ng pahintulot ang agent bago magsagawa ng mahahalagang aksyon, at maaaring pigilan, kunin ang kontrol sa browser, o itigil ng user ang mga gawain anumang oras. Simula ngayon, maaaring i-activate ng mga Pro, Plus, at Team user ang mga kakayahang ito sa pamamagitan ng tools dropdown sa pagpili ng 'agent mode' sa anumang usapan.

Ang paglulunsad na ito ang pinakamalaking pagtatangka ng OpenAI na gawing mula sa kasangkapan sa pagsagot ng tanong ang ChatGPT tungo sa isang agentic na produkto na kayang magsagawa ng mga aksyon at tumulong sa mga komplikadong gawain ng user. Bagama't nahirapan ang mga naunang AI agent sa mga komplikadong gawain, iginiit ng OpenAI na mas malawak ang kakayahan ng ChatGPT Agent kumpara sa mga naunang produkto, at may plano silang regular na pagbutihin ito upang lalo pang maging kapaki-pakinabang sa paglipas ng panahon.

Source:

Latest News