Googleは、年次開発者会議「I/O 2025」において、Gemini AIプラットフォームの大規模なアップデートを発表し、推論能力や教育分野での応用における進化を披露した。
今回の発表の目玉は、Gemini 2.5 Pro向けの実験的強化推論モード「Deep Think」の導入だ。この新機能は、応答前に複数の仮説を考慮できる研究技術を活用している。Googleによれば、2.5 Pro Deep Thinkは、現在最難関の数学ベンチマークの一つである2025 USAMOで優れたスコアを記録し、競技プログラミング向けの難関ベンチマーク「LiveCodeBench」でもトップの成績を収めている。
さらにGoogleは、学習特化型モデル「LearnLM」をGemini 2.5に直接統合し、「世界最高の学習モデル」と位置付けた。Googleの最新レポートによれば、Gemini 2.5 Proは学習科学の原則に関するあらゆるカテゴリで競合他社を上回った。 また、コーディング分野の「WebDev Arena」や、モデル応答に対する人間の好みを測る「LMArena」など、実世界の人気リーダーボードでも首位を獲得。教育向けに最適化されたLearnLMファミリーとの統合により、2.5 Proは教育効果の高さから教育者に最も支持される学習モデルとして評価されている。
GoogleのCEO、サンダー・ピチャイ氏は「Gemini 2.5 ProはLMArenaリーダーボードの全カテゴリを席巻している」と急速な進化を強調した。 また、「パワフルかつ最も効率的なワークホースモデル」とされる「Gemini 2.5 Flash」も披露。開発者からはその高速性と低コストが高く評価されているという。新しい2.5 Flashは、推論・マルチモーダル・コーディング・長文コンテキストなど主要ベンチマークで向上し、LMArenaリーダーボードでは2.5 Proに次ぐ成績を収めている。
Gemini 2.5 Flashは、Geminiアプリで誰でも利用可能となり、開発者向けのGoogle AI Studioや企業向けのVertex AIでは6月上旬から一般公開される予定。Gemini 2.5 Proも間もなく提供開始となる。Googleは「技術向上と安全かつ責任ある開発・提供に取り組む全社的な努力の成果」としている。
これらの進化を支えているのが、Googleの第7世代Tensor Processing Unit(TPU)「Ironwood」だ。Googleはこれを「これまでで最もパワフルで高性能、かつ省エネなTPU」と表現しており、大規模な推論型AIモデルの運用を目的に設計され、最も高負荷なAIトレーニングや提供業務を支えている。
これらのアップデートにより、GoogleはAIの推論力と教育分野での可能性の限界をさらに押し広げ、パフォーマンスの新たなベンチマークを打ち立てつつ、責任ある開発と導入にも注力している。