menu
close

구글, Gemini 2.5 Pro를 첨단 세계 시뮬레이션 모델로 진화

구글이 자사의 대표 AI 모델인 Gemini 2.5 Pro를 고도화된 '세계 모델'로 확장한다. 이 모델은 계획을 세우고 새로운 경험을 시뮬레이션할 수 있어, 인간의 인지 방식과 유사하게 세상의 다양한 측면을 이해하고 모델링할 수 있다. 이번 발전은 인공지능 분야에서 중요한 진전으로, 구글이 기기 전반에서 동작하는 범용 AI 어시스턴트 개발을 향한 중대한 발걸음이다.
구글, Gemini 2.5 Pro를 첨단 세계 시뮬레이션 모델로 진화

구글 딥마인드는 자사의 최첨단 멀티모달 기반 모델인 Gemini 2.5 Pro를 '세계 모델(world model)'로 진화시키기 위해 연구를 진행 중이다. 이 세계 모델은 인간의 인지 과정을 모방해 현실 세계의 다양한 측면을 이해하고 시뮬레이션할 수 있는 AI 시스템이다.

구글 I/O 2025에서 발표된 이 야심찬 프로젝트는, AI가 세상이 어떻게 작동하는지 모델링함으로써 계획을 세우고 새로운 경험을 상상할 수 있도록 하는 것을 목표로 한다. 딥마인드 CEO 데미스 하사비스는 "이러한 능력은 단순한 분류와 예측을 넘어서는, 인공지능의 근본적인 발전을 의미한다"고 강조했다.

하사비스는 최근 블로그 포스트에서 "우리는 최고의 멀티모달 기반 모델인 Gemini 2.5 Pro를 확장해, 뇌처럼 세상의 다양한 측면을 이해하고 시뮬레이션함으로써 계획을 세우고 새로운 경험을 상상할 수 있는 '세계 모델'로 만들고자 한다"고 설명했다.

구글은 이미 Gemini가 자연 환경을 표현하고 시뮬레이션하는 능력, Veo 모델을 통한 직관적 물리학 이해, Gemini Robotics를 통한 로봇의 물체 파악 및 명령 수행 등에서 세계 모델링의 초기 증거가 나타나고 있다고 밝혔다.

이번 개발은 맥락을 이해하고 기기 전반에서 계획을 세워 행동할 수 있는 '범용 AI 어시스턴트' 구축을 위한 중요한 단계로 평가된다. 구글의 궁극적인 목표는 Gemini 앱을 일상 업무 수행, 행정 처리, 맞춤형 추천 제공까지 가능한 어시스턴트로 진화시키는 것이다.

세계 모델 기능은 이미 뛰어난 Gemini 2.5 Pro의 추론 능력을 기반으로 한다. 이 모델은 복잡한 수학, 과학, 코딩 과제에서 업계 최고 수준의 벤치마크를 기록하고 있으며, AI 상호작용에 대한 인간 선호도를 측정하는 LMArena와 WebDev Arena 리더보드에서도 1위를 차지하고 있다.

구글은 이러한 세계 모델 기능을 멀티태스킹에 초점을 둔 Project Mariner, 시각적 이해에 중점을 둔 Project Astra와 통합할 계획이다. 강화된 Gemini 2.5 Pro는 현재 프리뷰 단계를 거쳐 2025년 6월 일반에 공개될 예정이다.

Source:

Latest News