구글은 제미니의 '에이전트 모드' 도입을 통해 AI 어시스턴스의 한계를 뛰어넘고 있다. 이는 기존의 반응형 질의응답 시스템에서 벗어나, 자율적으로 작업을 완수하는 능동형 에이전트로의 근본적 전환을 의미한다.
2025년 구글 I/O에서 발표된 에이전트 모드는 사용자가 단순히 목표만 제시하면, 제미니가 그 목표 달성을 위해 필요한 단계를 지능적으로 조율한다. 이 기능은 실시간 웹 브라우징, 심층 연구, 구글 앱과의 스마트 통합 등 고급 기능을 결합해, 사용자의 최소한의 개입으로도 복잡하고 다단계의 작업을 처리할 수 있다.
구글은 발표에서 "목표만 말하면 제미니가 이를 달성하기 위한 단계를 지능적으로 조율합니다"라고 설명했다. 이 기술은 프로젝트 마리너를 기반으로 하며, 브라우저 화면의 텍스트, 이미지, 폼 등 다양한 웹 요소를 이해하고 추론할 수 있는 구글의 실험적 AI 에이전트다.
구글은 또한 프로젝트 마리너의 컴퓨터 사용 기능을 제미니 API와 Vertex AI에도 도입해, 개발자들이 이러한 에이전트 기능을 활용한 애플리케이션을 구축할 수 있도록 지원한다. Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company, Cartwheel 등 여러 기업이 이미 이 가능성을 탐색 중이며, 올여름에는 더 많은 개발자에게 접근 권한이 제공될 예정이다.
이 기술은 사용자가 한 번 작업을 시연하면 AI가 이를 학습해 유사 작업을 반복 수행하는 '가르치고 반복하기(teach and repeat)' 기능 등 인상적인 역량을 보여준다. 실제 활용 예로, 에이전트 모드는 사용자의 조건에 맞춰 Zillow와 같은 사이트에서 아파트 매물을 검색하고, 필터를 조정하며, 투어 일정까지 자동으로 예약해줄 수 있다.
이러한 발전은 사용자가 AI 어시스턴트와 상호작용하는 방식에 있어 큰 진화를 의미한다. 이제 각 단계별로 명령을 내릴 필요 없이, 전체 목표를 제미니에 위임하면 AI가 필요한 조치를 스스로 판단하고 실행한다. 에이전트 모드의 실험 버전은 곧 Google AI Ultra 구독자에게 제공될 예정이며, 구글은 사용자 통제, 투명성, 보안 보호장치를 전 과정에 걸쳐 강조하고 있다.