Google издига AI видео генерирането на ново ниво с представянето на Veo 3 – революционен модел, който за първи път добавя аудио възможности към генерираните от изкуствен интелект видеа.
Официално обявен по време на Google I/O 2025 през май, Veo 3 представлява значителен напредък спрямо предишните AI видео генератори, като интегрира синхронизиран диалог, околни звуци и фонова музика директно във видеоклиповете. „За първи път излизаме от беззвучната ера на видео генерирането“, заяви Демиc Хасабис, изпълнителен директор на Google DeepMind, по време на анонса.
Технологията се отличава с възможността да създава реалистични видеа с точна физика, прецизно синхронизиране на устните и естествени движения. Потребителите могат да генерират видеа чрез текстови описания или изображения, като AI автоматично добавя подходящи аудио елементи, съответстващи на визуалното съдържание. Тази способност отличава Veo 3 от конкуренти като Sora на OpenAI, която все още няма вградена аудио генерация.
Успоредно с Veo 3, Google подобри и популярния модел Veo 2 с редица нови функции. Сред тях са генериране на видео по референция за последователни персонажи и обекти, разширени контроли на камерата за кинематографично движение, разширяване на кадъра (outpainting) отвъд оригиналните граници и интелигентно добавяне и премахване на обекти.
За да демонстрира творческия потенциал на тези инструменти, Google представи Flow – нова AI платформа за създаване на филми, която комбинира моделите Veo, Imagen и Gemini. Няколко режисьори вече са създали професионални късометражни филми с помощта на технологията, сред които емоционалната научнофантастична история „Kitsune“ на Анри Добре и изследването на идентичността „Dear Stranger“ на Джуни Лау.
Veo 3 вече е достъпен за абонати в САЩ на месечния план Google AI Ultra за $249.99 чрез приложението Gemini, както и за корпоративни клиенти през платформата Vertex AI. Технологията включва воден знак SynthID, който помага за идентифициране на AI съдържание и адресира опасенията относно дийпфейкове и дезинформация.