Googles Veo 3 bringt Ton in die KI-Videoerzeugung

Google hat Veo 3 vorgestellt, sein fortschrittlichstes KI-Modell zur Videoerzeugung, das erstmals Videos mit synchronisiertem Ton – einschließlich Dialogen und Soundeffekten – erstellen kann. Das bahnbrechende System ist für Google-AI-Ultra-Abonnenten in den USA sowie über Vertex AI verfügbar und markiert das Ende der „stummen Ära“ der KI-Videoerzeugung. Auch Veo 2 wurde um neue Funktionen wie Kamerasteuerung, Outpainting und Objektmanipulation erweitert.

Google hebt die KI-Videoerzeugung mit der Einführung von Veo 3 auf ein neues Niveau: Das bahnbrechende Modell ermöglicht erstmals die Integration von Audio in KI-generierte Videos.

Veo 3, das im Mai auf der Google I/O 2025 vorgestellt wurde, stellt einen bedeutenden Fortschritt gegenüber bisherigen KI-Videogeneratoren dar, da es synchronisierte Dialoge, Umgebungsgeräusche und Hintergrundmusik direkt in die generierten Clips einbindet. „Zum ersten Mal verlassen wir die stumme Ära der Videoerzeugung“, sagte Demis Hassabis, CEO von Google DeepMind, bei der Ankündigung.

Die Technologie überzeugt durch realistische Videos mit korrekter Physik, präzisem Lippenabgleich und natürlicher Bewegung. Nutzer können Videos anhand von Textbeschreibungen oder Bildreferenzen generieren, wobei die KI automatisch passende Audioelemente hinzufügt, die zum visuellen Inhalt passen. Damit hebt sich Veo 3 deutlich von Konkurrenten wie OpenAIs Sora ab, das derzeit keine native Audiogenerierung bietet.

Parallel zu Veo 3 hat Google auch das beliebte Modell Veo 2 um zahlreiche leistungsstarke Funktionen erweitert. Dazu gehören referenzbasierte Videos für konsistente Charaktere und Objekte, erweiterte Kamerasteuerung für filmische Bewegungen, Outpainting zur Erweiterung von Videoframes über die ursprünglichen Grenzen hinaus sowie intelligente Funktionen zum Hinzufügen und Entfernen von Objekten.

Um das kreative Potenzial dieser Tools zu demonstrieren, hat Google Flow vorgestellt – eine neue KI-Filmplattform, die Veo, Imagen und Gemini kombiniert. Mehrere Filmemacher haben bereits professionelle Kurzfilme mit der Technologie realisiert, darunter Henry Daubrez mit seiner emotionalen Sci-Fi-Geschichte „Kitsune“ und Junie Lau mit der Identitätserkundung „Dear Stranger“.

Veo 3 ist derzeit für US-Abonnenten des 249,99-Dollar-teuren AI-Ultra-Tarifs über die Gemini-App sowie für Unternehmenskunden über Googles Vertex-AI-Plattform verfügbar. Die Technologie enthält SynthID-Wasserzeichen, um KI-generierte Inhalte zu kennzeichnen und Bedenken hinsichtlich Deepfakes und Desinformation entgegenzuwirken.

Source:

Googles Veo 3 bringt Ton in die KI-Videoerzeugung

Latest News

Meta entfesselt LLaMA 4: Die Sprachrevolution der KI

Home Depot digitalisiert Expertenrat mit KI-gestützter Magic Apron

Shield AI sichert sich 240 Millionen US-Dollar – Boom bei Verteidigungstechnologien beschleunigt sich

KI-entwickeltes Medikament Rentosertib zeigt vielversprechende Ergebnisse in bahnbrechender klinischer Studie

Technologiekonzerne stellen fortschrittliche Enterprise-AI-Chatbot-Funktionen vor

Schweizer KI-Durchbruch senkt CO2-Emissionen von Zement drastisch

OpenAI erreicht 10-Milliarden-Dollar-Umsatzmarke, während KI-Adoption beschleunigt

Googles Gemini 2.5 Flash bringt verbesserte Programmierleistung

Microsoft fordert OpenAI mit neuer KI-Reasoning-Technologie heraus

KI-Modelle mit Schlussfolgerungsfähigkeiten stoßen 50-mal mehr CO₂ aus als einfache Modelle

Googles Veo 3 bringt Ton in die KI-Videoerzeugung

Related Articles

Microsoft fordert OpenAI mit neuer KI-Reasoning-Technologie heraus

Googles Gemini 2.5 Flash bringt verbesserte Programmierleistung

Googles Imagen 4 revolutioniert KI-Bilderzeugung mit lebensechten Details

Google stellt SynthID Detector zur Bekämpfung von KI-Inhalts-Täuschung vor

Meta entfesselt LLaMA 4: Die Sprachrevolution der KI

Latest News

Meta entfesselt LLaMA 4: Die Sprachrevolution der KI

Home Depot digitalisiert Expertenrat mit KI-gestützter Magic Apron

Shield AI sichert sich 240 Millionen US-Dollar – Boom bei Verteidigungstechnologien beschleunigt sich

KI-entwickeltes Medikament Rentosertib zeigt vielversprechende Ergebnisse in bahnbrechender klinischer Studie

Technologiekonzerne stellen fortschrittliche Enterprise-AI-Chatbot-Funktionen vor

Schweizer KI-Durchbruch senkt CO2-Emissionen von Zement drastisch

OpenAI erreicht 10-Milliarden-Dollar-Umsatzmarke, während KI-Adoption beschleunigt

Googles Gemini 2.5 Flash bringt verbesserte Programmierleistung

Microsoft fordert OpenAI mit neuer KI-Reasoning-Technologie heraus

KI-Modelle mit Schlussfolgerungsfähigkeiten stoßen 50-mal mehr CO₂ aus als einfache Modelle