menu
close

Google Veo 3 добавя звук към AI видео генерирането

Google представи Veo 3 – най-усъвършенствания си модел за AI видео генериране, който може да създава видеа със синхронизиран звук, включително диалог и звукови ефекти. Технологията е достъпна за абонати на Google AI Ultra в САЩ и чрез Vertex AI, като това постижение слага край на „беззвучната ера“ на AI видео генерирането. Google също така подобри Veo 2 с нови функции като управление на камерата, разширяване на кадъра и манипулация на обекти.
Google Veo 3 добавя звук към AI видео генерирането

Google издига AI видео генерирането на ново ниво с представянето на Veo 3 – революционен модел, който за първи път добавя аудио възможности към генерираните от изкуствен интелект видеа.

Официално обявен по време на Google I/O 2025 през май, Veo 3 представлява значителен напредък спрямо предишните AI видео генератори, като интегрира синхронизиран диалог, околни звуци и фонова музика директно във видеоклиповете. „За първи път излизаме от беззвучната ера на видео генерирането“, заяви Демиc Хасабис, изпълнителен директор на Google DeepMind, по време на анонса.

Технологията се отличава с възможността да създава реалистични видеа с точна физика, прецизно синхронизиране на устните и естествени движения. Потребителите могат да генерират видеа чрез текстови описания или изображения, като AI автоматично добавя подходящи аудио елементи, съответстващи на визуалното съдържание. Тази способност отличава Veo 3 от конкуренти като Sora на OpenAI, която все още няма вградена аудио генерация.

Успоредно с Veo 3, Google подобри и популярния модел Veo 2 с редица нови функции. Сред тях са генериране на видео по референция за последователни персонажи и обекти, разширени контроли на камерата за кинематографично движение, разширяване на кадъра (outpainting) отвъд оригиналните граници и интелигентно добавяне и премахване на обекти.

За да демонстрира творческия потенциал на тези инструменти, Google представи Flow – нова AI платформа за създаване на филми, която комбинира моделите Veo, Imagen и Gemini. Няколко режисьори вече са създали професионални късометражни филми с помощта на технологията, сред които емоционалната научнофантастична история „Kitsune“ на Анри Добре и изследването на идентичността „Dear Stranger“ на Джуни Лау.

Veo 3 вече е достъпен за абонати в САЩ на месечния план Google AI Ultra за $249.99 чрез приложението Gemini, както и за корпоративни клиенти през платформата Vertex AI. Технологията включва воден знак SynthID, който помага за идентифициране на AI съдържание и адресира опасенията относно дийпфейкове и дезинформация.

Source:

Latest News