menu
close

Google презентувала новітні інструменти ШІ для створення медіа нового покоління

На конференції Google I/O 2025 компанія представила Veo 3 — революційну модель штучного інтелекту, що генерує відео із синхронізованим аудіо, включаючи фонові звуки та діалоги персонажів. Також Google анонсувала Imagen 4, яка відтворює складні деталі з надзвичайною чіткістю та підтримує роздільну здатність до 2K. Ці передові моделі ШІ стали основою для Flow — нового інструменту для кінематографістів, який допомагає творцям втілювати свої ідеї на екрані.
Google презентувала новітні інструменти ШІ для створення медіа нового покоління

Google суттєво посилила свої можливості у сфері генерації медіа за допомогою ШІ, представивши моделі Veo 3 та Imagen 4 на щорічній конференції розробників I/O 20 травня 2025 року.

Veo 3 — новітня модель генерації відео від Google — стала справжнім проривом, адже вперше отримала можливість створювати аудіо. Модель генерує відео з синхронізованими фоновими звуками, такими як шум транспорту чи спів птахів, а також може створювати діалоги між персонажами з точним синхроном губ. Veo 3 демонструє покращене розуміння фізики реального світу та людських емоцій, що забезпечує більш реалістичні та деталізовані відео.

Поряд із Veo 3 Google презентувала Imagen 4 — свою найпросунутішу на сьогодні модель для генерації зображень. Imagen 4 відзначається здатністю відтворювати найдрібніші деталі: складні текстури тканин, краплі води, хутро тварин — усе з надзвичайною чіткістю. Модель підтримує різні співвідношення сторін і може створювати зображення у роздільній здатності до 2K, що робить їх придатними для друку чи презентацій. Також Google анонсувала швидку версію Imagen 4, яка буде до 10 разів швидшою за попередню, оптимізовану для швидкого прототипування та креативних робочих процесів.

Ці потужні моделі ШІ стали основою для Flow — нового інструменту Google для кінематографістів, що працює на базі штучного інтелекту. Flow поєднує можливості Veo, Imagen та Gemini, допомагаючи сценаристам і режисерам створювати кінематографічні кліпи та сцени. Серед функцій — Camera Controls для точного керування рухом камери, SceneBuilder для безшовного розширення кадрів і Asset Management для організації творчих елементів. Flow дозволяє зберігати послідовність персонажів і сцен у кількох кліпах, забезпечуючи цілісність розповіді.

Veo 3 наразі доступна для підписників Google AI Ultra у США за ціною $249,99 на місяць, а Imagen 4 можна використовувати через додаток Gemini, Whisk, Vertex AI та різні сервіси Google Workspace. Весь контент, створений цими моделями, містить водяні знаки SynthID для забезпечення прозорості та боротьби з дезінформацією.

Ці досягнення демонструють прагнення Google розширювати можливості ШІ для ширшого кола користувачів. Компанія також повідомила, що додатками Gemini вже користуються понад 400 мільйонів людей щомісяця, що свідчить про стрімке впровадження її технологій штучного інтелекту.

Source:

Latest News