Google Veo 3 wprowadza dźwięk do generowania wideo przez AI

Google zaprezentowało Veo 3, swój najbardziej zaawansowany model generowania wideo przez sztuczną inteligencję, który potrafi tworzyć filmy z zsynchronizowanym dźwiękiem, w tym dialogami i efektami dźwiękowymi. Technologia ta, dostępna dla subskrybentów Google AI Ultra w USA oraz poprzez Vertex AI, oznacza koniec „ery niemych filmów” generowanych przez AI. Google wzbogaciło także Veo 2 o nowe funkcje, takie jak kontrola kamery, outpainting oraz manipulacja obiektami.

Google wynosi generowanie wideo przez sztuczną inteligencję na nowy poziom dzięki premierze Veo 3 – przełomowego modelu, który po raz pierwszy dodaje do filmów tworzonych przez AI możliwości dźwiękowe.

Zaprezentowany podczas Google I/O 2025 w maju, Veo 3 stanowi znaczący krok naprzód względem wcześniejszych generatorów wideo AI, integrując zsynchronizowane dialogi, dźwięki otoczenia oraz muzykę w tle bezpośrednio w generowanych klipach. „Po raz pierwszy wychodzimy z ery niemych filmów w generowaniu wideo”, powiedział Demis Hassabis, CEO Google DeepMind, podczas ogłoszenia.

Technologia wyróżnia się tworzeniem realistycznych filmów z poprawną fizyką, precyzyjną synchronizacją ruchu ust i naturalną animacją. Użytkownicy mogą generować filmy, podając opisy tekstowe lub referencyjne obrazy, a AI automatycznie dodaje odpowiednie elementy dźwiękowe dopasowane do treści wizualnej. Ta funkcjonalność odróżnia Veo 3 od konkurencji, takiej jak Sora od OpenAI, która obecnie nie oferuje natywnego generowania dźwięku.

Równolegle z Veo 3, Google wzbogaciło popularny model Veo 2 o szereg nowych, zaawansowanych funkcji. Obejmują one generowanie wideo na podstawie referencji dla spójnych postaci i obiektów, zaawansowaną kontrolę kamery dla efektów filmowych, outpainting do rozszerzania kadrów poza oryginalne granice oraz inteligentne dodawanie i usuwanie obiektów.

Aby zaprezentować kreatywny potencjał tych narzędzi, Google wprowadziło Flow – nową platformę do tworzenia filmów AI, łączącą modele Veo, Imagen i Gemini. Kilku filmowców już stworzyło profesjonalnej jakości krótkie metraże z wykorzystaniem tej technologii, w tym emocjonalną opowieść science fiction „Kitsune” autorstwa Henry’ego Daubreza oraz eksplorację tożsamości w „Dear Stranger” Junie Lau.

Veo 3 jest obecnie dostępny dla amerykańskich subskrybentów planu Google AI Ultra za 249,99 USD miesięcznie poprzez aplikację Gemini, a także dla użytkowników biznesowych poprzez platformę Vertex AI. Technologia wykorzystuje znakowanie SynthID, które pomaga identyfikować treści generowane przez AI i przeciwdziałać problemom deepfake’ów oraz dezinformacji.

Source:

Google Veo 3 wprowadza dźwięk do generowania wideo przez AI

Latest News

Meta wypuszcza LLaMA 4: Rewolucja głosu w sztucznej inteligencji

Home Depot cyfryzuje fachowe porady dzięki Magic Apron opartemu na AI

Shield AI pozyskuje 240 mln dolarów w obliczu boomu na technologie obronne

Lek Rentosertib zaprojektowany przez AI obiecujący w przełomowych badaniach klinicznych

Giganci technologiczni prezentują zaawansowane funkcje chatbotów AI dla przedsiębiorstw

Szwajcarski przełom w AI radykalnie ogranicza emisję CO2 z cementu

OpenAI osiąga próg 10 mld dolarów przychodów wraz z przyspieszającą adopcją AI

Google Gemini 2.5 Flash wprowadza ulepszoną moc kodowania

Microsoft rzuca wyzwanie OpenAI nową technologią AI do rozumowania

Modele AI z zaawansowanym rozumowaniem emitują 50 razy więcej dwutlenku węgla niż podstawowe

Google Veo 3 wprowadza dźwięk do generowania wideo przez AI

Related Articles

Microsoft rzuca wyzwanie OpenAI nową technologią AI do rozumowania

Google Gemini 2.5 Flash wprowadza ulepszoną moc kodowania

Imagen 4 od Google rewolucjonizuje generowanie obrazów przez AI dzięki realistycznym detalom

Google prezentuje detektor SynthID w walce z dezinformacją AI

Meta wypuszcza LLaMA 4: Rewolucja głosu w sztucznej inteligencji

Latest News

Meta wypuszcza LLaMA 4: Rewolucja głosu w sztucznej inteligencji

Home Depot cyfryzuje fachowe porady dzięki Magic Apron opartemu na AI

Shield AI pozyskuje 240 mln dolarów w obliczu boomu na technologie obronne

Lek Rentosertib zaprojektowany przez AI obiecujący w przełomowych badaniach klinicznych

Giganci technologiczni prezentują zaawansowane funkcje chatbotów AI dla przedsiębiorstw

Szwajcarski przełom w AI radykalnie ogranicza emisję CO2 z cementu

OpenAI osiąga próg 10 mld dolarów przychodów wraz z przyspieszającą adopcją AI

Google Gemini 2.5 Flash wprowadza ulepszoną moc kodowania

Microsoft rzuca wyzwanie OpenAI nową technologią AI do rozumowania

Modele AI z zaawansowanym rozumowaniem emitują 50 razy więcej dwutlenku węgla niż podstawowe