구글이 자사의 대표 AI 모델인 Gemini 2.5 Pro와 Flash 모델에 사고 요약(Thought Summaries) 기능을 추가하며 큰 발전을 이뤘다. 이 기능은 Gemini API와 Vertex AI를 통해 제공된다.
사고 요약은 모델의 원시 사고 과정을 헤더, 주요 세부 정보, 도구 사용 시점 등 모델의 행동 정보를 포함한 명확하고 구조화된 형식으로 변환한다. 이 기능은 AI의 추론 과정을 더욱 투명하게 하고, 디버깅을 용이하게 만드는 중요한 진전으로 평가된다.
구글은 "모델의 사고 과정을 더 구조적이고 간결한 형식으로 제공함으로써, 개발자와 사용자가 Gemini 모델과의 상호작용을 더 쉽게 이해하고 디버깅할 수 있기를 기대한다"고 2025년 Google I/O에서 밝혔다.
사고 요약 기능은 Gemini 2.5 제품군의 다른 개선 사항들과 함께 제공된다. 여기에는 Gemini 2.5 Pro로 사고 예산(Thinking Budgets) 확장도 포함된다. 이 기능은 기존에는 Flash에서만 제공됐으나, 이제 개발자가 모델이 응답 전에 사고에 사용할 토큰 수를 제어하거나 사고 기능을 완전히 끌 수 있게 하여, 비용, 품질, 지연 시간 간의 균형을 세밀하게 조정할 수 있다.
엔터프라이즈 사용자에게 사고 요약은 신뢰성과 조정 가능성 측면에서 획기적인 발전이다. 정책 검토, 코드 논리 확인, 복잡한 연구 요약 등 중요한 작업에서 AI 결과를 평가하는 조직은 이제 모델이 결론에 도달한 과정을 투명하게 확인할 수 있어, 이해관계자에게 AI 의사결정 과정을 명확히 설명할 수 있다.
구글은 Gemini 2.5 Flash가 현재 개발자를 위한 Google AI Studio, 기업을 위한 Vertex AI, 모든 사용자를 위한 Gemini 앱에서 프리뷰로 제공된다고 밝혔다. 업데이트된 버전은 6월 초에 정식 출시될 예정이며, Gemini 2.5 Pro도 곧이어 제공될 예정이다.