Google DeepMindは、これまでで最も洗練されたテキストから画像生成モデル「Imagen 4」を正式に発表し、AIによるビジュアル制作のための強力な新ツールを開発者に提供する。
このリリースは、2025年7月15日よりGemini APIおよびGoogle AI Studioで利用可能となり、Imagen 4ファミリーには2種類のモデルが用意されている。標準のImagen 4モデルは1枚あたり0.04ドルで、幅広い画像生成タスクに対応するGoogleの主力モデルだ。より高精度なテキストプロンプトへの対応が求められる用途向けには、Imagen 4 Ultraが1枚あたり0.06ドルで提供され、さらなる高機能を実現している。
Imagen 4は前世代モデルから大きな進化を遂げており、Googleは「繊細な生地や水滴、動物の毛並みといった細部の驚くべき鮮明さ」を強調。フォトリアルから抽象的なスタイルまで幅広く対応し、最大2Kの解像度や多様なアスペクト比をサポートする。
特筆すべきは、AI画像生成で長年課題とされてきたテキスト描画能力が劇的に向上した点だ。この進化により、マーケティング資料やポスター、招待状、コミックなど、画像とテキストを組み合わせたビジュアル制作において大きな価値を発揮する。
GoogleのLabsグループを率いるJosh Woodward氏は「Imagen 4は品質面で大きな前進です。特にテキストやタイポグラフィの生成に多くの注意と修正を加えたので、スライドや招待状など、画像と文字を組み合わせるあらゆる用途に最適です」とコメントしている。
また、Googleのエコシステム、特にWorkspaceアプリケーションへの統合により、さまざまなクリエイティブやプロフェッショナルなワークフローの生産性向上も期待される。Googleは今後数週間以内に追加の課金プランを導入し、リクエストに応じてより高いレート制限も提供予定。さらに、Imagen 3の最大10倍の速度で動作する高速バリアントのリリースも計画している。