menu
close

구글, 차세대 AI 미디어 제작 도구 공개

구글은 I/O 2025에서 동기화된 오디오(환경음, 캐릭터 대사 포함)와 함께 영상을 생성하는 혁신적 AI 모델 Veo 3를 선보였다. 또한, 정교한 디테일을 탁월한 선명도로 구현하고 최대 2K 해상도를 지원하는 Imagen 4도 공개했다. 이 첨단 AI 모델들은 창작자의 시네마틱 비전을 실현하도록 돕는 구글의 새로운 영화 제작 도구 Flow의 핵심 엔진으로 활용된다.
구글, 차세대 AI 미디어 제작 도구 공개

구글은 2025년 5월 20일 연례 I/O 개발자 컨퍼런스에서 Veo 3와 Imagen 4를 공개하며 AI 기반 미디어 생성 기술을 크게 진화시켰다.

Veo 3는 구글의 최신 영상 생성 모델로, 최초로 오디오 생성 기능을 도입하며 큰 도약을 이뤘다. 이 모델은 교통 소음, 새소리 등 배경음과 함께, 캐릭터 간의 대사를 정확한 입 모양과 동기화하여 영상에 삽입할 수 있다. Veo 3는 실제 물리 현상과 인간 표정에 대한 이해도가 향상되어 더욱 사실적이고 세밀한 영상 결과물을 제공한다.

함께 공개된 Imagen 4는 구글이 지금까지 선보인 이미지 생성 모델 중 가장 진보된 버전이다. Imagen 4는 복잡한 직물, 물방울, 동물의 털 등 미세한 디테일을 탁월한 선명도로 구현한다. 다양한 화면 비율을 지원하며, 최대 2K 해상도의 이미지를 생성할 수 있어 인쇄나 프레젠테이션에도 적합하다. 구글은 또한, 기존보다 최대 10배 빠른 속도의 '패스트 버전' Imagen 4도 출시할 계획임을 밝혔다. 이 버전은 빠른 프로토타이핑과 창작 워크플로우에 최적화되어 있다.

이 강력한 AI 모델들은 구글의 새로운 AI 기반 영화 제작 도구 Flow의 핵심 엔진으로 활용된다. Flow는 Veo, Imagen, Gemini의 기능을 결합해 스토리텔러가 시네마틱한 클립과 장면을 손쉽게 제작할 수 있도록 돕는다. 정밀한 카메라 움직임을 위한 Camera Controls, 장면을 자연스럽게 확장하는 SceneBuilder, 창작 요소를 효율적으로 관리하는 Asset Management 등 다양한 기능을 제공한다. Flow는 여러 클립에 걸쳐 캐릭터와 장면의 일관성을 유지할 수 있어, 더욱 완성도 높은 스토리텔링 경험을 제공한다.

Veo 3는 현재 미국 내 Google AI Ultra 구독자에게 월 249.99달러에 제공되며, Imagen 4는 Gemini 앱, Whisk, Vertex AI, 다양한 Google Workspace 애플리케이션을 통해 이용할 수 있다. 이들 모델이 생성하는 모든 콘텐츠에는 투명성과 허위 정보 방지를 위해 SynthID 워터마크가 삽입된다.

이러한 혁신은 더 많은 사용자가 AI 기술을 활용할 수 있도록 하겠다는 구글의 의지를 반영한다. 구글은 이번 행사에서 Gemini 앱의 월간 활성 사용자가 4억 명을 돌파했다고 발표하며, 자사 AI 기술의 빠른 확산을 입증했다.

Source:

Latest News