구글은 2025년 5월 20일 연례 I/O 개발자 컨퍼런스에서 Gemini 2.5 모델 패밀리의 대규모 업데이트를 발표하며 AI 역량을 대폭 확장했다.
가장 주목받는 혁신은 Gemini 2.5 Pro에 적용된 실험적 강화 추론 모드인 Deep Think다. 이 모드는 모델이 응답 전에 여러 가설을 병렬로 고려할 수 있게 하며, 구글 딥마인드 CEO 데미스 하사비스는 이를 "사고와 추론 분야의 최첨단 연구를 통해 모델 성능의 한계를 극복했다"고 평가했다.
Deep Think는 이미 난이도 높은 벤치마크에서 탁월한 성과를 보였다. 2025년 USAMO 수학 경시대회에서 인상적인 점수를 기록했고, 경쟁 프로그래밍용 LiveCodeBench에서 선두를 차지했으며, 멀티모달 추론 과제인 MMMU에서는 84%의 성과를 달성했다. 이러한 최전선 기술력으로 인해 구글은 초기에는 신뢰할 수 있는 테스터에게만 접근을 허용하고, 추가적인 안전성 평가를 진행 중이다.
또한 구글은 Gemini 2.5 Flash를 Gemini 앱에서 모든 사용자가 이용할 수 있도록 공개했다. 이 버전은 추론, 코딩, 멀티모달 작업에서 성능이 향상되었으며, 토큰 사용량도 20~30% 절감됐다. 업데이트된 버전은 6월 초 Google AI Studio의 개발자와 Vertex AI의 기업 고객에게 일반 제공될 예정이며, 2.5 Pro도 곧 뒤따를 예정이다.
구글은 투명성과 제어권 강화를 위해 Gemini API와 Vertex AI에 사고 요약 기능을 도입한다. 이를 통해 모델의 추론 과정을 구조화된 형식으로 정리할 수 있다. 또한 2.5 Pro에는 사고 예산(Thinking Budget) 기능도 확장되어, 개발자가 모델이 응답 전에 얼마나 깊이 생각할지 직접 조절할 수 있다.
이러한 업데이트와 함께 구글은 AI 구독 등급 체계를 재편했다. 기존 AI Premium은 Google AI Pro(월 $19.99)로 리브랜딩되었고, 새로운 Google AI Ultra(월 $249.99) 등급은 최고 사용 한도, Deep Think 모드 등 실험적 기능의 조기 접근, Veo 3와 같은 고급 동영상 생성 도구(네이티브 오디오 포함) 독점 제공을 특징으로 한다.
개발자에게 Gemini 2.5 Pro는 여전히 복잡한 작업에 가장 앞선 구글의 모델로, WebDev Arena와 LMArena 리더보드 모두에서 선두를 차지하고 있다. 또한 구글은 Gemini 2.5를 Google 검색에 통합해, AI 모드가 미국 전역의 모든 사용자에게 제공되고 있으며, AI 모드와 AI 오버뷰 모두 곧 Gemini 2.5의 커스텀 버전으로 구동될 예정이다.