구글은 프로젝트 마리너의 컴퓨터 활용 기능을 Gemini API와 Vertex AI 플랫폼에 통합하며, 에이전틱 AI 시스템 개발에 있어 중요한 진전을 이뤘다.
2024년 말 처음 공개된 프로젝트 마리너는 구글 딥마인드가 웹 브라우저를 통한 인간-에이전트 상호작용을 연구하기 위해 개발한 프로토타입이다. 이 시스템은 브라우저에 표시된 내용을 관찰하고, 복잡한 목표를 해석하며, 실행 가능한 계획을 세우고, 웹사이트를 탐색해 자율적으로 작업을 완수할 수 있다. 동시에 여러 작업을 처리할 수 있으며, 최신 버전은 최대 10개의 서로 다른 작업을 한 번에 수행할 수 있다.
이미 여러 기술 기업이 프로젝트 마리너의 가능성을 탐색하고 있다. 에이전틱 프로세스 자동화 분야의 선두주자인 Automation Anywhere와 자동화 플랫폼으로 잘 알려진 UiPath가 초기 도입 기업에 포함된다. 그 외에도 AI 브라우저 자동화 프레임워크를 개발하는 Browserbase, Autotab, The Interaction Company, 2023년에 설립된 텍스트-투-애니메이션 플랫폼 Cartwheel 등이 파트너로 참여하고 있다.
Gemini API와 Vertex AI와의 통합을 통해 개발자들은 이러한 에이전트 기능을 활용한 애플리케이션을 구축할 수 있게 된다. 구글은 간접 프롬프트 인젝션 등 위협에 대한 보안도 대폭 강화해, Gemini 2.5를 지금까지 가장 안전한 모델 계열로 만들었다.
미국 내 Google AI Ultra 구독자는 이미 프로젝트 마리너를 이용할 수 있으며, 올여름에는 더 많은 개발자에게 접근 권한이 제공될 예정이다. 또한 구글은 마리너의 일부 기능을 Search Labs의 AI 모드 등 자사 다른 제품에도 도입할 계획이다. 이를 통해 이벤트 티켓 구매, 레스토랑 예약 등 다양한 작업이 가능해진다.
이러한 발전은 사용자가 인터넷과 상호작용하는 방식을 근본적으로 변화시킬 수 있다. 직접 웹사이트를 이용하는 대신, AI 에이전트에게 작업을 위임하는 방식으로 전환될 수 있기 때문이다. 이 기능이 성숙해지면 산업 전반의 자동화 혁신과 AI 어시스턴트의 새로운 활용 사례가 등장할 것으로 기대된다.