Googleは、フラッグシップAIモデルであるGemini 2.5 Proに「Deep Thinkモード」を導入し、AIの推論能力において大きな飛躍を遂げたと発表した。
Deep Thinkは最新の並列思考技術を活用し、モデルが応答を返す前に複数の解決策を同時に探索・評価できる。これは、人間の専門家が複雑な問題に取り組む際に様々な角度や仮説を検討するアプローチに近い。
「最先端の推論研究、特に並列思考技術を活用しており、驚異的なパフォーマンスを実現しています」と、Google DeepMind CEOのデミス・ハサビス氏はGoogle I/O 2025の発表で述べた。
新モードは、難易度の高いベンチマークで卓越した成果を示している。2025年の米国数学オリンピック(USAMO)では、最難関の数学ベンチマークの一つである同大会で高得点を記録。また、競技レベルのコーディング向けベンチマーク「LiveCodeBench」でもトップの成績を収め、様々なタスクにおけるマルチモーダル推論を評価する「MMMU」では84%のスコアを達成した。
Deep Thinkに加え、GoogleはGemini 2.5ファミリー全体のセキュリティも大幅に強化した。AIモデルが取得するデータ内に悪意ある指示が埋め込まれる「間接的プロンプトインジェクション攻撃」への高度な防御策を導入。Googleによれば、新たなセキュリティアプローチにより、ツール利用時のこれら攻撃に対する防御率が大きく向上し、2.5シリーズが同社史上最も安全なモデル群となった。
GoogleはDeep Thinkの導入に慎重な姿勢を示している。「2.5 Pro DeepThinkでフロンティアを切り拓いているため、さらなる安全性評価や専門家の意見収集に時間をかけています」と同社はコメント。まずは信頼できるテスターにGemini API経由で提供し、フィードバックを得た後に一般公開を予定している。
また、Googleは高速・低コストを重視した効率型モデル「Gemini 2.5 Flash」の改良も発表。新バージョンはトークン消費量を20〜30%削減しつつ、推論・マルチモーダル・コード・長文コンテキストの各ベンチマークで性能向上を実現した。