Google DeepMind підняла планку у сфері генерації відео за допомогою штучного інтелекту, представивши Veo 3 — свою найскладнішу на сьогодні модель для створення відео. Анонсована на Google I/O 2025, нова модель забезпечує кінематографічну якість відео у роздільній здатності 1080p з безпрецедентним рівнем реалістичності та контролю.
Головна особливість Veo 3 — це нативна генерація аудіо, що дозволяє створювати відео з атмосферними звуками, звуковими ефектами та навіть синхронізованим діалогом персонажів. Це суттєво відрізняє модель від конкурентів, зокрема Sora від OpenAI. Така інтеграція усуває потребу у використанні окремих інструментів для створення аудіо, спрощуючи творчий процес.
«Veo 3 відзначається у всьому — від текстових і візуальних підказок до реалістичної фізики та точного синхрону губ», — пояснює віцепрезидент з продукту Google DeepMind Елі Коллінз. Модель демонструє значне покращення у дотриманні підказок, дозволяючи користувачам з високою точністю задавати кінематографічні елементи, такі як рухи камери, освітлення та композицію сцени.
Наразі Veo 3 доступна підписникам Google AI Ultra у США за ціною $249,99 на місяць. Модель інтегрована з Flow — новим інструментом для створення фільмів на основі ШІ, розробленим спеціально для професіоналів у сфері творчості. Платформа дозволяє режисерам та контент-кріейторам створювати відео високої якості без традиційних виробничих ресурсів.
Технологія передбачає низку заходів безпеки, зокрема водяні знаки SynthID на кожному кадрі для ідентифікації контенту, створеного ШІ. Це відповідає зростаючим побоюванням щодо можливих зловживань, зокрема створення дипфейків чи маніпулятивних відео.
У міру того, як інструменти генерації відео на основі ШІ стають дедалі досконалішими, конкуренція між Google та OpenAI лише посилюється. Хоча Sora пропонує довші відео та потужну симуляцію фізики, інтегроване аудіо та кінематографічний контроль у Veo 3 роблять її привабливим вибором для професійних творців контенту, які шукають універсальне рішення для відеопродакшну.