Google DeepMindは、AI生成動画の分野で新たな基準を打ち立てるべく、これまでで最も洗練された動画生成モデル「Veo 3」を発表した。Google I/O 2025で発表されたこの新モデルは、1080pの解像度で映画品質の動画をこれまでにないリアリズムとコントロールで生成できる。
Veo 3の最大の特徴は、ネイティブ音声生成機能だ。これにより、環境音や効果音、キャラクターのセリフまで同期させた動画を一括で制作できる。OpenAIのSoraなど競合モデルとの大きな差別化ポイントであり、従来必要だった別途の音声制作ツールが不要となり、クリエイティブなワークフローが大幅に効率化される。
Google DeepMindプロダクト担当副社長のイーライ・コリンズ氏は「Veo 3はテキストや画像プロンプトから、現実世界の物理法則、正確なリップシンクまで卓越した性能を発揮します」と説明する。プロンプトへの忠実度も大きく向上し、カメラワークやライティング、シーン構成など、映画的な要素を細部まで指定できる精密な編集が可能となった。
現在、Veo 3は米国のGoogle AI Ultraサブスクリプション(月額249.99ドル)で利用可能。さらに、クリエイター向けに設計された新しいAI映像制作ツール「Flow」と統合されており、従来の制作リソースを必要とせずに高品質な動画コンテンツを作成できる。
また、あらゆるフレームにSynthIDによる透かしを埋め込むなど、AI生成コンテンツの識別を可能にする複数の安全対策も導入。ディープフェイクやメディア操作といった悪用への懸念にも対応している。
AI動画生成ツールの高度化が進む中、GoogleとOpenAIの競争はさらに激化している。Soraは長尺動画や高度な物理シミュレーションを強みとする一方、Veo 3は音声統合や映画的なコントロール機能により、オールインワンの動画制作ソリューションを求めるプロフェッショナルなクリエイターにとって魅力的な選択肢となっている。