menu
close

Google、先進的推論機能を備えた「Gemini 2.5 Flash」を発表

Googleは、高速かつコスト効率に優れたAIモデルの最新バージョン「Gemini 2.5 Flash」のプレビュー版を公開しました。本バージョンでは、開発者がモデルの思考プロセスを制御できるハイブリッド推論機能を新たに導入し、速度と効率性を維持しながら大幅な進化を遂げています。プレビューはGoogle AI Studio、Vertex AI、Geminiアプリで利用可能で、2025年6月初旬に一般提供が予定されています。
Google、先進的推論機能を備えた「Gemini 2.5 Flash」を発表

Googleは、高速かつコスト効率に優れたAIモデル「Gemini 2.5 Flash」のプレビュー版をリリースしました。

Gemini 2.0 Flashを基盤としつつ、2.5 Flashは推論機能を大幅に強化し、効率性を損なうことなく進化を遂げています。Googleは本モデルについて「推論能力が大幅に向上しつつも、速度とコストを最優先している」と説明しています。

2.5 Flashの最大の特徴は、ハイブリッド推論システムです。Googleによれば「初の完全ハイブリッド推論モデルであり、開発者は思考機能のオン・オフや“思考バジェット”の設定によって、品質・コスト・遅延のバランスを最適化できる」とのこと。この革新的なアプローチにより、開発者は複雑なタスク処理におけるモデルの思考プロセスをこれまでにないレベルで制御できます。

実際には、開発者は“思考バジェット”を指定することで、モデルがどれだけ推論を行うかをコントロールできます。Google AI StudioやVertex AIでは、スライダーやAPIパラメータを使って「思考中に生成できるトークン数」を0から24,576トークンまで調整可能です。思考バジェットをゼロに設定した場合、コストや遅延はGemini 2.0 Flashと同等になります。

価格設定もこの柔軟性を反映しています。推論機能を使わない場合、入力トークンは100万あたり15セント、出力トークンは100万あたり60セントですが、思考機能を有効にすると100万トークンあたり3.50ドルに上昇します。

ベンチマークテストでは、優れた結果が示されています。Gemini 2.5 Flashは「LMArenaのHard Promptsで2.5 Proに次ぐ高いパフォーマンスを発揮し、他の主要モデルと同等の指標を、はるかに低コストかつ小型で実現している」とされ、「価格対性能比で引き続きトップを維持」しています。

Googleは2.5 Flashを「速度と低コストを追求した最も効率的な主力モデル」と位置付けており、「推論・マルチモーダル・コード・長文コンテキストの主要ベンチマークで向上しつつ、さらに効率化され、評価時にはトークン使用量が20〜30%削減された」と説明しています。

新モデルは現在、複数のチャネルでプレビュー提供中です。Google AI Studio(開発者向け)、Vertex AI(エンタープライズ向け)、Geminiアプリ(一般向け)で順次展開されています。GoogleのI/O 2025発表によると、2025年6月初旬にはGoogle AI StudioおよびVertex AIで一般提供が開始され、Gemini 2.5 Proも間もなくリリース予定です。

GoogleがAI機能の拡充を続ける中、Gemini 2.5 Flashは高度な推論をより手軽かつコスト効率良く開発者やユーザーに提供する大きな一歩となります。

Source:

Latest News