menu
close

Google DeepMindのVeo3、AI動画生成に音声をもたらす

Google DeepMindは、革新的な動画生成モデル「Veo3」を159カ国以上のGeminiユーザー向けにグローバル展開しました。この先進的なAIシステムは、セリフや環境音、効果音など、映像と完全に同期した高精細な音声付き動画を生成します。Google AI ProおよびUltraのサブスクライバーが利用可能で、Veo3はAIによるコンテンツ制作技術の大きな飛躍を示しています。
Google DeepMindのVeo3、AI動画生成に音声をもたらす

Googleは、最先端の動画生成モデル「Veo3」のグローバル展開を完了し、2025年7月3日より159カ国以上のGeminiユーザーがこの技術を利用できるようになりました。この拡大は、AIによる動画生成の大きな節目となり、Google DeepMindのCEOデミス・ハサビス氏は「動画生成の“無声時代”からの脱却」と表現しています。

2025年5月のGoogle I/Oで初公開されたVeo3は、前世代モデルから大きく進化し、高精細な映像と完全に同期した音声を生成できるようになりました。リアルなセリフや環境音、効果音を映像に合わせて作り出し、非常に現実感のある動画を実現します。最大4K解像度での動画生成が可能ですが、一般ユーザー向けの標準出力は720pとなっています。

Veo3の利用にはサブスクリプションプランによる制限があります。Google AI Ultra($249.99/月)では全機能が利用可能で、AI Pro($19.99/月)では1日あたり最大3本、各8秒までの「Veo3 Fast」動画を生成できます。この技術は、Veo3とImagenやGeminiなど他のDeepMindモデルを組み合わせたGoogleの新しいAI映像制作ツール「Flow」にも統合されています。

ディープフェイク対策として複数の安全対策も導入されています。Google独自の「SynthID」透かし技術は、生成された各フレームに不可視のマーカーを埋め込み、管理下のテストで99.3%の検出精度を実現しています。さらに、各動画にはC2PA規格に準拠した作成メタデータが付与され、エンドツーエンドでの追跡が可能です。

業界関係者は、エンターテインメント分野以外での応用にも注目しています。デミス・ハサビス氏は最近、「プレイ可能なワールドモデル」に関するSNS投稿に「それは面白いことになるだろう」とコメントし、ゲーム分野での利用可能性を示唆しました。一方で、2025年7月初旬にはVeo3を使って生成された人種差別的・反ユダヤ的な動画がTikTok上に出現したとMedia Matters for Americaが報告しており、既に論争も巻き起こっています。

Source:

Latest News