구글이 자사의 대표 AI 모델인 제미니 2.5 프로에 '딥 씽크(Deep Think)' 모드를 도입하며 AI 추론 능력에서 큰 도약을 이뤘다.
딥 씽크는 최신 병렬 사고(parallel thinking) 연구를 적용해, 모델이 응답을 내놓기 전 여러 잠재적 해결책을 동시에 탐색·평가할 수 있도록 한다. 이는 인간 전문가가 복잡한 문제를 다양한 각도와 가설로 접근하는 방식과 유사하다.
"최신 추론 연구, 특히 병렬 사고 기법을 활용해 놀라운 성능을 달성했습니다."라고 데미스 허사비스 구글 딥마인드 CEO는 2025년 구글 I/O 행사에서 밝혔다.
딥 씽크 모드는 까다로운 벤치마크에서 탁월한 결과를 보였다. 세계 최고 난이도의 수학 평가 중 하나인 2025 미국 수학 올림피아드(USAMO)에서 뛰어난 점수를 기록했으며, 대회 수준 코딩 벤치마크인 LiveCodeBench에서도 선두를 차지했다. 또한, 다양한 과제의 멀티모달 추론을 평가하는 MMMU에서 84%의 점수를 획득했다.
딥 씽크 외에도 구글은 제미니 2.5 시리즈 전반에 걸쳐 보안을 크게 강화했다. AI가 가져오는 데이터에 악의적 명령을 숨기는 간접 프롬프트 인젝션 공격에 대응하기 위해 고도화된 방어책을 적용했다. 구글에 따르면, 이 새로운 보안 접근법으로 도구 사용 중 해당 공격에 대한 보호율이 크게 높아졌으며, 2.5 시리즈가 구글 역사상 가장 안전한 모델군이 됐다.
구글은 딥 씽크의 도입에 신중을 기하고 있다. "2.5 프로 딥 씽크로 AI의 최전선을 개척하고 있기 때문에, 추가적인 안전성 평가와 전문가 의견 수렴에 더 많은 시간을 투자하고 있습니다."라고 회사 측은 밝혔다. 초기에는 신뢰할 수 있는 테스터에게만 제미니 API를 통해 딥 씽크를 제공하고, 피드백을 수집한 뒤 점차 확대할 계획이다.
또한, 구글은 속도와 비용 효율성을 중시한 모델인 제미니 2.5 플래시(Gemini 2.5 Flash)도 개선했다. 업데이트된 버전은 토큰 사용량을 20~30% 줄이면서도 추론, 멀티모달, 코드, 장문 컨텍스트 등 다양한 벤치마크에서 성능을 향상시켰다.