menu
close

구글, Gemini 2.5 Pro를 진화된 '월드 모델'로 발전시킨다

구글이 Gemini 2.5 Pro를 복잡한 환경 내에서 이해, 시뮬레이션, 계획 수립이 가능한 정교한 '월드 모델'로 전환할 계획을 발표했다. 이로써 AI는 인간의 인지처럼 세계의 다양한 측면을 모델링하여 계획을 세우고 새로운 경험을 상상할 수 있게 된다. 또한 Gemini 2.5 Flash가 이제 널리 제공되며, 2.5 Pro도 곧 출시될 예정임을 알렸다. 두 모델 모두 강화된 보안과 복잡한 추론을 위한 Deep Think 등 새로운 기능이 탑재된다.
구글, Gemini 2.5 Pro를 진화된 '월드 모델'로 발전시킨다

구글이 인공지능 분야에서 중요한 도약을 시도하고 있다. Gemini 2.5 Pro를 인간의 인지 방식을 모방해 현실의 다양한 측면을 이해하고 시뮬레이션할 수 있는 종합적인 '월드 모델'로 확장할 계획이다.

월드 모델은 AI의 역량에 있어 근본적인 변화를 의미한다. 단순한 언어 처리에서 벗어나 물리적 환경에 대한 내부 표현을 생성하는 것이다. 이 개념은 지능형 에이전트가 외부의 상호작용 환경을 이해하고 모델링하여 의사결정과 계획 능력을 향상시키는 데 초점을 둔다. 최초에는 저수준의 물리적 상호작용을 모델링하는 데 사용되었으나, 현재는 실제 세계의 시뮬레이션과 복잡하고 현실적인 환경 생성으로 확장되고 있다.

이러한 정교한 AI 시스템은 이미지, 오디오, 비디오, 텍스트 등 방대한 멀티모달 데이터셋을 활용해 실제 환경을 시뮬레이션한다. 이를 통해 AI는 다양한 행동의 결과를 예측할 수 있으며, 추론 및 계획 능력이 크게 향상된다. 월드 모델은 원시 데이터와 실행 가능한 인사이트 사이의 격차를 효과적으로 메워, 기계와 환경 간의 더욱 직관적인 상호작용을 가능하게 한다.

구글은 Gemini 2.5 Pro를 "뇌처럼 세계의 다양한 측면을 이해하고 시뮬레이션함으로써 계획을 세우고 새로운 경험을 상상할 수 있는 월드 모델로 확장하고 있다"고 밝혔다. 이 발전은 구글의 AI 전략에 있어 중요한 진전으로, 다양한 분야에서 더욱 정교한 문제 해결이 가능해질 전망이다.

이러한 야심찬 진화와 더불어, 구글은 Gemini 모델 패밀리의 여러 업데이트도 공개했다. Gemini 2.5 Flash는 이제 Gemini 앱에서 모든 사용자에게 제공되며, 6월 초에는 개발자를 위한 Google AI Studio와 기업용 Vertex AI에서도 업데이트 버전이 일반 공개될 예정이다. 이어서 Gemini 2.5 Pro도 출시된다.

Gemini 2.5 Pro에는 고난도 수학 및 코딩 작업을 위한 실험적 추론 모드인 Deep Think가 탑재된다. 구글은 두 모델 모두에 첨단 보안 기능도 도입한다. 새로운 보안 접근법을 통해 툴 사용 시 간접 프롬프트 인젝션 공격에 대한 방어가 크게 강화되어, Gemini 2.5 시리즈가 지금까지 가장 안전한 모델이 되었다.

이러한 발전은 AI 분야의 경쟁이 치열해지는 가운데 이루어지고 있다. Nvidia와 World Labs와 같은 스타트업도 월드 모델 기술을 개발 중이다. 대형 언어 모델이 ChatGPT와 같은 시스템의 핵심이라면, 월드 모델은 로봇 및 기타 AI 시스템 훈련에 필요한 가상 세계 시뮬레이터의 핵심이다. 이 도구들은 3D 환경과 시뮬레이션을 생성해 로봇이 주변을 더 잘 이해하고, 계획하며, 탐색할 수 있도록 돕는다.

구글이 AI 역량의 한계를 계속해서 넓혀가는 가운데, Gemini 2.5 Pro의 월드 모델 진화는 인공지능이 정보를 처리하는 수준을 넘어, 세계를 이해하고 예측하며 점점 더 인간에 가까운 방식으로 상호작용할 수 있는 새로운 시대의 도래를 알리고 있다.

Source:

Latest News