Googleは、AIの機能とセキュリティの両面で大きな進化を遂げたGemini 2.5 Flashを全ユーザー向けに正式リリースしました。
新バージョンは現在Geminiアプリで利用可能で、さまざまな面で大幅な改良が施されています。Google DeepMindの責任者デミス・ハサビス氏によれば、Gemini 2.5 Flashは「ほぼすべての面で優れている」とされ、推論、マルチモーダル、コード、長文コンテキストの各ベンチマークでパフォーマンスが向上しています。特筆すべきは、同等の応答を生成しながら22%の効率化を達成し、より少ないトークンで動作する点です。
今回のリリースではセキュリティにも大きな焦点が当てられています。Googleは、ツール利用時の間接的なプロンプトインジェクション攻撃に対する保護を大幅に強化する高度なセーフガードを導入しました。これらの攻撃は、AIモデルが取得するデータ内に悪意のある指示が埋め込まれることで発生します。モデルの堅牢化、入出力チェック、システムレベルのガードレールを組み合わせることで、Gemini 2.5はこれまでで最も安全なモデルファミリーとなりました。
開発者は6月上旬よりGoogle AI Studioで、企業はVertex AIを通じてアップデート版にアクセス可能となり、Gemini 2.5 Proも間もなくリリースされる予定です。今回のリリースには、モデルの推論過程を見出しや要点で構造化して整理する「思考サマリー」など、開発者向けの新機能も含まれており、やり取りの理解やデバッグが容易になります。
Gemini 2.5 Proには、特に高度な数学やコーディングタスク向けに設計された実験的推論モード「Deep Think」も搭載予定です。この機能により、モデルは応答前に複数の仮説を検討でき、2025年USAMO数学テストや競技プログラミング用のLiveCodeBenchなど、難易度の高いベンチマークでも優れたスコアを記録しています。
さらに、Gemini 2.5ファミリーには新たな音声機能も追加されました。24言語・複数話者対応のネイティブテキスト読み上げ(TTS)を搭載し、AIの声のトーンやアクセント、話し方をカスタマイズ可能です。ユーザーの声に含まれる感情を検知し、それに応じて応答することもできます。
これらの進化により、GoogleはGeminiを消費者と企業の双方に向けた先進的なAIプラットフォームとして位置づけ、強力な機能と強化されたセキュリティの両立を実現しています。