Google wynosi generowanie wideo przez sztuczną inteligencję na nowy poziom dzięki premierze Veo 3 – przełomowego modelu, który po raz pierwszy dodaje do filmów tworzonych przez AI możliwości dźwiękowe.
Zaprezentowany podczas Google I/O 2025 w maju, Veo 3 stanowi znaczący krok naprzód względem wcześniejszych generatorów wideo AI, integrując zsynchronizowane dialogi, dźwięki otoczenia oraz muzykę w tle bezpośrednio w generowanych klipach. „Po raz pierwszy wychodzimy z ery niemych filmów w generowaniu wideo”, powiedział Demis Hassabis, CEO Google DeepMind, podczas ogłoszenia.
Technologia wyróżnia się tworzeniem realistycznych filmów z poprawną fizyką, precyzyjną synchronizacją ruchu ust i naturalną animacją. Użytkownicy mogą generować filmy, podając opisy tekstowe lub referencyjne obrazy, a AI automatycznie dodaje odpowiednie elementy dźwiękowe dopasowane do treści wizualnej. Ta funkcjonalność odróżnia Veo 3 od konkurencji, takiej jak Sora od OpenAI, która obecnie nie oferuje natywnego generowania dźwięku.
Równolegle z Veo 3, Google wzbogaciło popularny model Veo 2 o szereg nowych, zaawansowanych funkcji. Obejmują one generowanie wideo na podstawie referencji dla spójnych postaci i obiektów, zaawansowaną kontrolę kamery dla efektów filmowych, outpainting do rozszerzania kadrów poza oryginalne granice oraz inteligentne dodawanie i usuwanie obiektów.
Aby zaprezentować kreatywny potencjał tych narzędzi, Google wprowadziło Flow – nową platformę do tworzenia filmów AI, łączącą modele Veo, Imagen i Gemini. Kilku filmowców już stworzyło profesjonalnej jakości krótkie metraże z wykorzystaniem tej technologii, w tym emocjonalną opowieść science fiction „Kitsune” autorstwa Henry’ego Daubreza oraz eksplorację tożsamości w „Dear Stranger” Junie Lau.
Veo 3 jest obecnie dostępny dla amerykańskich subskrybentów planu Google AI Ultra za 249,99 USD miesięcznie poprzez aplikację Gemini, a także dla użytkowników biznesowych poprzez platformę Vertex AI. Technologia wykorzystuje znakowanie SynthID, które pomaga identyfikować treści generowane przez AI i przeciwdziałać problemom deepfake’ów oraz dezinformacji.