menu
close

Google Veo 3 wprowadza dźwięk do generowania wideo przez AI

Google zaprezentowało Veo 3, swój najbardziej zaawansowany model generowania wideo przez sztuczną inteligencję, który potrafi tworzyć filmy z zsynchronizowanym dźwiękiem, w tym dialogami i efektami dźwiękowymi. Technologia ta, dostępna dla subskrybentów Google AI Ultra w USA oraz poprzez Vertex AI, oznacza koniec „ery niemych filmów” generowanych przez AI. Google wzbogaciło także Veo 2 o nowe funkcje, takie jak kontrola kamery, outpainting oraz manipulacja obiektami.
Google Veo 3 wprowadza dźwięk do generowania wideo przez AI

Google wynosi generowanie wideo przez sztuczną inteligencję na nowy poziom dzięki premierze Veo 3 – przełomowego modelu, który po raz pierwszy dodaje do filmów tworzonych przez AI możliwości dźwiękowe.

Zaprezentowany podczas Google I/O 2025 w maju, Veo 3 stanowi znaczący krok naprzód względem wcześniejszych generatorów wideo AI, integrując zsynchronizowane dialogi, dźwięki otoczenia oraz muzykę w tle bezpośrednio w generowanych klipach. „Po raz pierwszy wychodzimy z ery niemych filmów w generowaniu wideo”, powiedział Demis Hassabis, CEO Google DeepMind, podczas ogłoszenia.

Technologia wyróżnia się tworzeniem realistycznych filmów z poprawną fizyką, precyzyjną synchronizacją ruchu ust i naturalną animacją. Użytkownicy mogą generować filmy, podając opisy tekstowe lub referencyjne obrazy, a AI automatycznie dodaje odpowiednie elementy dźwiękowe dopasowane do treści wizualnej. Ta funkcjonalność odróżnia Veo 3 od konkurencji, takiej jak Sora od OpenAI, która obecnie nie oferuje natywnego generowania dźwięku.

Równolegle z Veo 3, Google wzbogaciło popularny model Veo 2 o szereg nowych, zaawansowanych funkcji. Obejmują one generowanie wideo na podstawie referencji dla spójnych postaci i obiektów, zaawansowaną kontrolę kamery dla efektów filmowych, outpainting do rozszerzania kadrów poza oryginalne granice oraz inteligentne dodawanie i usuwanie obiektów.

Aby zaprezentować kreatywny potencjał tych narzędzi, Google wprowadziło Flow – nową platformę do tworzenia filmów AI, łączącą modele Veo, Imagen i Gemini. Kilku filmowców już stworzyło profesjonalnej jakości krótkie metraże z wykorzystaniem tej technologii, w tym emocjonalną opowieść science fiction „Kitsune” autorstwa Henry’ego Daubreza oraz eksplorację tożsamości w „Dear Stranger” Junie Lau.

Veo 3 jest obecnie dostępny dla amerykańskich subskrybentów planu Google AI Ultra za 249,99 USD miesięcznie poprzez aplikację Gemini, a także dla użytkowników biznesowych poprzez platformę Vertex AI. Technologia wykorzystuje znakowanie SynthID, które pomaga identyfikować treści generowane przez AI i przeciwdziałać problemom deepfake’ów oraz dezinformacji.

Source:

Latest News