menu
close

GoogleのVeo 3、AI動画生成に音声機能を追加

Googleは、音声や効果音、セリフを同期させた動画を生成できる、これまでで最も高度なAI動画生成モデル「Veo 3」を発表した。米国内のGoogle AI UltraサブスクライバーおよびVertex AIを通じて利用可能となるこの革新的な技術は、AI動画生成の“サイレント時代”に終止符を打つものだ。また、GoogleはVeo 2にもカメラ制御やアウトペインティング、オブジェクト操作機能などの新機能を追加した。
GoogleのVeo 3、AI動画生成に音声機能を追加

Googleは、AIによる動画生成の新たな時代を切り開く「Veo 3」を発表した。この画期的なモデルは、AI生成動画に初めて音声機能を搭載した。

2025年5月のGoogle I/Oで発表されたVeo 3は、従来のAI動画生成モデルを大きく進化させ、セリフや環境音、BGMなどを動画クリップに直接同期させることが可能となった。Google DeepMindのCEO、デミス・ハサビス氏は発表の場で「ついに動画生成のサイレント時代から脱却します」と語った。

この技術は、リアルな物理表現や正確なリップシンク、自然な動きの動画生成に優れている。ユーザーはテキストによる指示や画像リファレンスを入力するだけで、AIが映像内容に合った音声要素を自動的に付加する。この機能により、現時点で音声生成機能を持たないOpenAIのSoraなど他社製品との差別化が図られている。

さらにGoogleは、人気のVeo 2モデルにも複数の新機能を追加した。これには、キャラクターやオブジェクトの一貫性を保つリファレンス動画生成、映画のような動きを実現する高度なカメラ制御、映像の枠を拡張するアウトペインティング、オブジェクトの追加・削除機能などが含まれる。

Googleはこれらのツールの創造的な可能性を示すため、Veo、Imagen、Geminiを統合した新AI映像制作プラットフォーム「Flow」も発表。すでに複数の映像作家がこの技術を用いてプロ品質の短編映画を制作しており、アンリ・ドブレーズによる感動的なSF作品「Kitsune」や、ジュニー・ラウによるアイデンティティをテーマにした「Dear Stranger」などが誕生している。

Veo 3は現在、米国内のGoogleの月額249.99ドルのAI Ultraプラン加入者向けGeminiアプリ、および企業向けのVertex AIプラットフォームで利用可能。AI生成コンテンツの識別やディープフェイク・偽情報対策のため、SynthIDによる透かし機能も搭載されている。

Source:

Latest News