menu
close

Google、次世代AIツールで高度なメディア制作を革新

GoogleはI/O 2025で、音声や環境音、キャラクターの会話まで同期生成できる画期的なAI動画モデル「Veo 3」を発表。また、細部まで鮮明に描写し最大2K解像度に対応する画像生成AI「Imagen 4」も公開した。これら先進AIモデルは、映像制作支援ツール「Flow」の中核技術としても活用され、クリエイターの映像表現を大きく拡張する。
Google、次世代AIツールで高度なメディア制作を革新

Googleは2025年5月20日に開催された年次開発者会議「Google I/O」にて、AIによるメディア生成技術を大きく進化させる「Veo 3」と「Imagen 4」を発表しました。

最新の動画生成モデル「Veo 3」は、Googleとして初めて音声生成機能を搭載。交通音や鳥のさえずりなどの環境音、キャラクター同士の会話まで、映像と完全に同期した音声を自動生成できます。さらに、現実世界の物理法則や人間の表情理解も向上し、よりリアルで細やかな動画表現が可能となっています。

同時に発表された「Imagen 4」は、Google史上最も高度な画像生成AIです。繊細な布地や水滴、動物の毛並みなど、微細なディテールまで鮮明に描写。多様なアスペクト比に対応し、最大2K解像度の高精細画像を生成できるため、印刷やプレゼンテーション用途にも最適です。さらに、従来比最大10倍の高速化を実現した「Imagen 4 Fast Variant」も今後提供予定で、迅速なプロトタイピングやクリエイティブワークフローを強力に支援します。

これらの先進AIモデルは、Googleの新しい映像制作ツール「Flow」の基盤技術としても活用されています。Flowは、Veo、Imagen、Geminiの各AI技術を統合し、ストーリーテラーがシネマティックな映像やシーンを手軽に創出できるよう設計。カメラワークを自在に制御できる「Camera Controls」、シーンを自然に拡張する「SceneBuilder」、素材を一元管理できる「Asset Management」など、多彩な機能を搭載しています。これにより、複数のクリップ間でキャラクターやシーンの一貫性を保ち、より統一感のあるストーリーテリングが可能となります。

Veo 3は現在、米国内のGoogle AI Ultraサブスクリプション(月額249.99ドル)で提供中。Imagen 4はGeminiアプリ、Whisk、Vertex AI、Google Workspace各種アプリから利用できます。生成コンテンツには全て「SynthID」ウォーターマークが付与され、透明性の確保と誤情報対策も徹底されています。

これらの進化は、GoogleがAI技術の裾野をさらに広げる姿勢の表れでもあります。実際、Geminiアプリの月間アクティブユーザー数は4億人を突破し、同社AI技術の急速な普及を裏付けています。

Source:

Latest News