구글이 Veo 3를 출시하며 AI 영상 생성 기술을 한 단계 끌어올렸다. Veo 3는 AI가 생성한 영상에 오디오 기능을 처음으로 더한 혁신적인 모델이다.
2025년 5월 Google I/O에서 공개된 Veo 3는 기존 AI 영상 생성기 대비 비약적인 발전을 이뤘다. 동기화된 대사, 환경음, 배경음악을 영상에 직접 삽입할 수 있게 된 것이다. 구글 딥마인드 CEO 데미스 하사비스는 발표 현장에서 "우리는 이제 영상 생성의 무성 시대를 벗어나고 있다"고 밝혔다.
이 기술은 사실적인 물리 효과, 정밀한 립싱크, 자연스러운 동작 구현에 강점을 보인다. 사용자는 텍스트 설명이나 이미지 참고 자료만 제공하면, AI가 시각적 콘텐츠에 맞는 적절한 오디오 요소를 자동으로 추가한다. 이러한 기능은 현재 오디오 생성 기능이 없는 OpenAI의 Sora 등 경쟁사와 Veo 3를 차별화한다.
Veo 3와 함께 구글은 기존 인기 모델 Veo 2에도 여러 강력한 기능을 추가했다. 캐릭터와 객체 일관성을 위한 레퍼런스 기반 영상 생성, 시네마틱 무빙을 위한 고급 카메라 제어, 영상 프레임을 원본 경계 밖으로 확장하는 아웃페인팅, 지능형 객체 추가 및 제거 기능 등이 포함됐다.
구글은 Veo, Imagen, Gemini 모델을 결합한 새로운 AI 영화 제작 플랫폼 'Flow'도 선보였다. 이미 여러 영화 제작자들이 이 기술을 활용해 전문적인 단편 영화를 제작했다. 대표적으로 헨리 도브레즈의 감성 SF 스토리 'Kitsune', 주니 라우의 정체성 탐구작 'Dear Stranger' 등이 있다.
Veo 3는 현재 미국 내 월 249.99달러의 Google AI Ultra 요금제 구독자(Gemini 앱)와 기업용 Vertex AI 플랫폼을 통해 제공된다. 이 기술에는 AI 생성 콘텐츠 식별을 위한 SynthID 워터마킹이 적용되어, 딥페이크 및 허위정보에 대한 우려를 해소한다.