구글은 연례 개발자 컨퍼런스 I/O 2025에서 Gemini AI 플랫폼의 주요 업데이트를 공개하며, 추론 능력과 교육 분야 활용에서의 진전을 선보였다.
주요 발표는 Gemini 2.5 Pro를 위한 실험적 고도 추론 모드인 Deep Think의 도입이었다. 이 새로운 기능은 모델이 답변 전에 여러 가설을 고려할 수 있도록 하는 연구 기법을 적용했다. 구글에 따르면, 2.5 Pro Deep Think는 2025년 USAMO(미국 수학 올림피아드)에서 인상적인 점수를 기록했으며, 경쟁 수준의 코딩 벤치마크인 LiveCodeBench에서도 선두를 차지했다.
구글은 또한 LearnLM을 Gemini 2.5에 직접 통합해 "세계 최고의 학습 모델"로 자리매김했다고 밝혔다. 구글의 최신 보고서에 따르면, Gemini 2.5 Pro는 학습 과학 원칙의 모든 범주에서 경쟁 모델을 능가했다. 이 모델은 이제 코딩 분야의 WebDev Arena, 모델 응답에 대한 인간 선호도를 측정하는 LMArena 등 실제 환경 리더보드에서도 1위를 차지하고 있다. 교육에 특화된 LearnLM과의 통합 덕분에, 2.5 Pro는 교육 효과성 측면에서 교사들에게 선호되는 최고의 학습 모델로 평가받고 있다.
순다 피차이 구글 CEO는 Gemini 모델의 빠른 발전을 강조하며 "Gemini 2.5 Pro가 LMArena 리더보드 모든 부문을 석권했다"고 언급했다. 또한 구글은 "강력하면서도 가장 효율적인 실무형 모델"로 소개된 Gemini 2.5 Flash를 선보였다. 이 모델은 "속도와 저렴한 비용을 선호하는 개발자들에게 큰 인기를 끌고 있다"고 평가받았다. 신규 2.5 Flash는 추론, 멀티모달, 코드, 장문 컨텍스트 등 주요 벤치마크에서 성능이 향상되었으며, LMArena 리더보드에서는 2.5 Pro에 이어 2위를 기록했다.
Gemini 2.5 Flash는 현재 Gemini 앱에서 모든 사용자에게 제공되고 있으며, 6월 초에는 개발자를 위한 Google AI Studio와 기업용 Vertex AI에서도 일반 제공될 예정이다. Gemini 2.5 Pro도 곧이어 출시된다. 구글은 이러한 진전을 "기술 향상과 안전하고 책임감 있는 개발·출시를 위해 전사적으로 노력한 결과"라고 밝혔다.
이러한 혁신의 기반에는 구글의 7세대 텐서 프로세싱 유닛(TPU)인 Ironwood가 있다. 구글은 Ironwood를 "지금까지 가장 강력하고, 유능하며, 에너지 효율이 뛰어난 TPU"라고 소개했다. Ironwood는 대규모 추론형 AI 모델을 위해 설계되었으며, 구글의 가장 까다로운 AI 학습 및 서비스 워크로드를 지원하고 있다.
이러한 업데이트를 통해 구글은 AI 추론과 교육 분야에서 새로운 성능 기준을 제시하며, 책임 있는 개발과 배포를 강조하는 동시에 AI의 한계를 계속 확장하고 있다.