Google Veo 3 добавя звук към AI видео генерирането

Google представи Veo 3 – най-усъвършенствания си модел за AI видео генериране, който може да създава видеа със синхронизиран звук, включително диалог и звукови ефекти. Технологията е достъпна за абонати на Google AI Ultra в САЩ и чрез Vertex AI, като това постижение слага край на „беззвучната ера“ на AI видео генерирането. Google също така подобри Veo 2 с нови функции като управление на камерата, разширяване на кадъра и манипулация на обекти.

Google издига AI видео генерирането на ново ниво с представянето на Veo 3 – революционен модел, който за първи път добавя аудио възможности към генерираните от изкуствен интелект видеа.

Официално обявен по време на Google I/O 2025 през май, Veo 3 представлява значителен напредък спрямо предишните AI видео генератори, като интегрира синхронизиран диалог, околни звуци и фонова музика директно във видеоклиповете. „За първи път излизаме от беззвучната ера на видео генерирането“, заяви Демиc Хасабис, изпълнителен директор на Google DeepMind, по време на анонса.

Технологията се отличава с възможността да създава реалистични видеа с точна физика, прецизно синхронизиране на устните и естествени движения. Потребителите могат да генерират видеа чрез текстови описания или изображения, като AI автоматично добавя подходящи аудио елементи, съответстващи на визуалното съдържание. Тази способност отличава Veo 3 от конкуренти като Sora на OpenAI, която все още няма вградена аудио генерация.

Успоредно с Veo 3, Google подобри и популярния модел Veo 2 с редица нови функции. Сред тях са генериране на видео по референция за последователни персонажи и обекти, разширени контроли на камерата за кинематографично движение, разширяване на кадъра (outpainting) отвъд оригиналните граници и интелигентно добавяне и премахване на обекти.

За да демонстрира творческия потенциал на тези инструменти, Google представи Flow – нова AI платформа за създаване на филми, която комбинира моделите Veo, Imagen и Gemini. Няколко режисьори вече са създали професионални късометражни филми с помощта на технологията, сред които емоционалната научнофантастична история „Kitsune“ на Анри Добре и изследването на идентичността „Dear Stranger“ на Джуни Лау.

Veo 3 вече е достъпен за абонати в САЩ на месечния план Google AI Ultra за $249.99 чрез приложението Gemini, както и за корпоративни клиенти през платформата Vertex AI. Технологията включва воден знак SynthID, който помага за идентифициране на AI съдържание и адресира опасенията относно дийпфейкове и дезинформация.

Source:

Google Veo 3 добавя звук към AI видео генерирането

Latest News

Meta представя LLaMA 4: Революция в гласовия изкуствен интелект

Home Depot дигитализира експертните съвети с AI-платформата Magic Apron

Shield AI осигурява 240 млн. долара на фона на ускорения бум в отбранителните технологии

AI-създаденото лекарство Рентосертиб показва обещаващи резултати в ключово клинично изпитване

Технологични гиганти представиха усъвършенствани AI чатбот функции за бизнеса

Швейцарски пробив в изкуствения интелект драстично намалява въглеродните емисии от цимента

OpenAI достигна приходи от 10 млрд. долара на фона на ускорено навлизане на изкуствения интелект

Gemini 2.5 Flash на Google носи подобрени възможности за програмиране

Microsoft предизвиква OpenAI с нова технология за AI-логическо разсъждение

Моделите за логическо разсъждение с изкуствен интелект отделят 50 пъти повече въглерод от базовите

Google Veo 3 добавя звук към AI видео генерирането

Related Articles

Microsoft предизвиква OpenAI с нова технология за AI-логическо разсъждение

Gemini 2.5 Flash на Google носи подобрени възможности за програмиране

Imagen 4 на Google революционизира AI-генерирането на изображения с фотореалистични детайли

Google представи SynthID Detector за борба с подвеждащо AI съдържание

Meta представя LLaMA 4: Революция в гласовия изкуствен интелект

Latest News

Meta представя LLaMA 4: Революция в гласовия изкуствен интелект

Home Depot дигитализира експертните съвети с AI-платформата Magic Apron

Shield AI осигурява 240 млн. долара на фона на ускорения бум в отбранителните технологии

AI-създаденото лекарство Рентосертиб показва обещаващи резултати в ключово клинично изпитване

Технологични гиганти представиха усъвършенствани AI чатбот функции за бизнеса

Швейцарски пробив в изкуствения интелект драстично намалява въглеродните емисии от цимента

OpenAI достигна приходи от 10 млрд. долара на фона на ускорено навлизане на изкуствения интелект

Gemini 2.5 Flash на Google носи подобрени възможности за програмиране

Microsoft предизвиква OpenAI с нова технология за AI-логическо разсъждение

Моделите за логическо разсъждение с изкуствен интелект отделят 50 пъти повече въглерод от базовите