구글 딥마인드는 AI 기반 영상 생성 분야에서 새로운 기준을 제시하며, 지금까지 가장 정교한 영상 생성 모델인 Veo 3를 공개했다. 구글 I/O 2025에서 발표된 이 신형 모델은 1080p 해상도의 시네마틱 품질 영상과 전례 없는 사실감, 그리고 세밀한 제어 기능을 제공한다.
Veo 3의 가장 큰 특징은 네이티브 오디오 생성 기능이다. 이 기능을 통해 주변 소리, 효과음, 심지어 캐릭터의 대사까지 동기화된 오디오가 포함된 영상을 생성할 수 있다. 이는 오픈AI의 Sora와 차별화되는 핵심 요소로, 별도의 오디오 제작 도구 없이도 창작 워크플로우를 간소화할 수 있다.
구글 딥마인드 제품 부사장 엘리 콜린스(Eli Collins)는 "Veo 3는 텍스트 및 이미지 프롬프트부터 실제 물리 시뮬레이션, 정확한 립싱크까지 모두 뛰어나다"고 설명했다. 이 모델은 프롬프트 반영 능력이 크게 향상되어, 사용자가 카메라 움직임, 조명, 장면 구성 등 세부적인 영화적 요소를 높은 정밀도로 지정할 수 있다.
현재 Veo 3는 미국 내 구글 AI 울트라(Google AI Ultra) 구독자에게 월 249.99달러에 제공된다. Veo 3는 크리에이티브 전문가를 위해 설계된 구글의 신형 AI 영상 제작 도구인 'Flow'와 통합되어, 영화 제작자와 콘텐츠 크리에이터가 전통적인 제작 자원 없이도 고품질 영상 콘텐츠를 제작할 수 있도록 지원한다.
이 기술에는 모든 프레임에 AI 생성 콘텐츠임을 식별할 수 있는 SynthID 워터마킹 등 다양한 안전장치가 적용됐다. 이는 딥페이크나 조작된 미디어 생성에 대한 우려를 해소하기 위한 조치다.
AI 영상 생성 도구가 점점 더 정교해지면서 구글과 오픈AI 간의 경쟁도 더욱 치열해지고 있다. Sora가 더 긴 영상 시퀀스와 강력한 물리 시뮬레이션을 제공하는 반면, Veo 3는 통합 오디오와 시네마틱 제어 기능으로 올인원 영상 제작 솔루션을 찾는 전문 크리에이터들에게 매력적인 선택지로 자리매김하고 있다.