Googleは、Gemini 2.5モデルファミリーを強化し、最もコスト効率が高く、最速となる「Gemini 2.5 Flash-Lite」を新たに追加しました。
2025年7月2日に発表されたFlash-Liteは、一般提供が開始されたGemini 2.5 FlashおよびProモデルとともに、用途に応じた3段階のラインアップを完成させました。Flash-Liteは特に翻訳や分類などの大量・低遅延タスク向けに設計されており、ベンチマークテストでは従来のFlashモデルよりも低遅延を実現しています。
スピードとコスト最適化を図りつつも、Flash-LiteはGemini 2.5ファミリーの中核機能――100万トークンのコンテキストウィンドウ、マルチモーダル入力対応、Google検索やコード実行などのツールとの互換性――を維持しています。他のモデルと異なり、Flash-Liteでは思考機能がデフォルトでオフになっており、最大限の効率化を実現していますが、必要に応じて有効化することも可能です。
モデル拡充とあわせて、GoogleはGeminiを開発者のターミナルから直接利用できるオープンソースAIエージェント「Gemini CLI」も発表しました。Apache 2.0ライセンスで公開されており、コーディングやコンテンツ作成、課題解決、タスク管理などに軽量なアクセスを提供します。開発者は個人のGoogleアカウントでGemini 2.5 Proを無料利用でき、1分あたり60回、1日あたり1,000回という十分な利用上限が設けられています。
CLIツールはシステムプロンプトや設定による柔軟なカスタマイズが可能で、多様なワークフローに適応します。また、GoogleのAIコーディングアシスタント「Gemini Code Assist」とも連携し、さまざまな開発環境で統一された体験を提供します。
これらのリリースは、高度なAI機能をより多くの人に開放し、パフォーマンスやコスト要件に応じた選択肢を提供するというGoogleの戦略を反映しています。Gemini 2.5ファミリーは、複雑なタスク向けの高性能Proモデルから、大量処理用途のコスト効率型Flash-Liteまで、幅広いニーズに対応するラインアップとなりました。