YouTube znacząco rozbudował swoje możliwości w zakresie sztucznej inteligencji, integrując zaawansowany model generowania wideo Veo 2 od Google DeepMind z platformą Shorts. Dzięki temu twórcy mogą tworzyć wysokiej jakości treści wideo za pomocą prostych poleceń tekstowych.
Integracja umożliwia twórcom generowanie klipów wideo przez AI do swoich postów, co stanowi odpowiedź Google na generator tekstu na wideo Sora od OpenAI. Choć YouTube wcześniej oferował generowane przez AI tła do Shorts w ramach funkcji Dream Screen, Veo 2 idzie o krok dalej, pozwalając na tworzenie samodzielnych klipów wideo, które można dodać do dowolnego Shorta.
Według YouTube, Veo 2 generuje nowoczesne, wysokiej jakości filmy obejmujące szeroki zakres tematów i stylów, lepiej odpowiadając wizjom twórców. Technologia przetwarza filmy szybciej niż wcześniejsze wersje i wykazuje lepsze zrozumienie fizyki świata rzeczywistego oraz ruchu ludzi, co przekłada się na bardziej szczegółowe i realistyczne efekty. Twórcy mogą nawet określać konkretne style, obiektywy czy efekty filmowe, co czyni Dream Screen intuicyjnym narzędziem do kreatywnej ekspresji.
Aby skorzystać z nowych funkcji, twórcy mogą uzyskać dostęp do Dream Screen poprzez opcję Green Screen w kamerze Shorts, gdzie mogą wpisywać polecenia tekstowe do generowania filmów. Funkcjonalność została uruchomiona w lutym 2025 roku dla twórców w Stanach Zjednoczonych, Kanadzie, Australii i Nowej Zelandii, a YouTube planuje rozszerzyć dostęp na kolejne regiony.
Aby przeciwdziałać potencjalnym nadużyciom, YouTube wykorzystuje technologię SynthID od DeepMind do osadzania cyfrowych znaków wodnych w filmach stworzonych przez AI. Cała zawartość generowana przez AI jest wyraźnie oznaczona, aby widzowie mogli ją łatwo zidentyfikować. To odpowiedzialne podejście obejmuje początkowo ograniczone wdrożenie do wybranych produktów, zanim funkcje trafią na platformę YouTube Shorts w 2025 roku, a wszystkie filmy generowane przez AI będą oznaczane niewidocznymi znakami wodnymi SynthID.
Najnowszy rozwój wpisuje się w szerszą strategię Google dotyczącą wideo AI, która niedawno zaowocowała premierą modelu Veo 3 w maju 2025 roku. Nowsza wersja jeszcze bardziej rozwija możliwości generowania wideo, dodając funkcje audio, w tym dialogi, ścieżki dźwiękowe i efekty dźwiękowe. W miarę rozwoju tych technologii obiecują one zrewolucjonizować sposób tworzenia treści na jednej z największych platform wideo na świecie, potencjalnie demokratyzując produkcję wysokiej jakości filmów dla twórców bez zaawansowanych umiejętności technicznych czy specjalistycznego sprzętu.