Η Google ανέβασε τη δημιουργία βίντεο με τεχνητή νοημοσύνη σε νέα επίπεδα με την κυκλοφορία του Veo 3, ενός πρωτοποριακού μοντέλου που προσθέτει για πρώτη φορά ηχητικές δυνατότητες στα βίντεο που παράγονται από AI.
Παρουσιάστηκε στο Google I/O 2025 τον Μάιο, το Veo 3 αποτελεί σημαντική εξέλιξη σε σχέση με προηγούμενα εργαλεία δημιουργίας βίντεο με AI, ενσωματώνοντας συγχρονισμένο διάλογο, ατμοσφαιρικούς ήχους και μουσική υπόκρουση απευθείας στα παραγόμενα κλιπ. «Για πρώτη φορά, βγαίνουμε από τη σιωπηλή εποχή της δημιουργίας βίντεο», δήλωσε ο Demis Hassabis, CEO της Google DeepMind, κατά την ανακοίνωση.
Η τεχνολογία διακρίνεται στη δημιουργία ρεαλιστικών βίντεο με ακριβή φυσική, τέλειο συγχρονισμό χειλιών και φυσική κίνηση. Οι χρήστες μπορούν να δημιουργούν βίντεο παρέχοντας περιγραφές κειμένου ή εικόνες αναφοράς, με την τεχνητή νοημοσύνη να προσθέτει αυτόματα κατάλληλα ηχητικά στοιχεία που ταιριάζουν με το οπτικό περιεχόμενο. Αυτή η δυνατότητα διαφοροποιεί το Veo 3 από ανταγωνιστές όπως το Sora της OpenAI, το οποίο προς το παρόν δεν υποστηρίζει εγγενή παραγωγή ήχου.
Παράλληλα με το Veo 3, η Google ενίσχυσε το δημοφιλές Veo 2 με αρκετές ισχυρές νέες λειτουργίες. Σε αυτές περιλαμβάνονται βίντεο με αναφορές για σταθερούς χαρακτήρες και αντικείμενα, προηγμένος έλεγχος κάμερας για κινηματογραφική κίνηση, outpainting για επέκταση των καρέ πέρα από τα αρχικά όρια και ευφυής προσθήκη ή αφαίρεση αντικειμένων.
Για να αναδείξει τις δημιουργικές δυνατότητες αυτών των εργαλείων, η Google παρουσίασε το Flow, μια νέα πλατφόρμα κινηματογραφικής δημιουργίας με AI που συνδυάζει τα μοντέλα Veo, Imagen και Gemini. Ήδη αρκετοί σκηνοθέτες έχουν δημιουργήσει επαγγελματικής ποιότητας ταινίες μικρού μήκους με τη συγκεκριμένη τεχνολογία, όπως η συγκινητική sci-fi ιστορία «Kitsune» του Henry Daubrez και η εξερεύνηση της ταυτότητας στο «Dear Stranger» της Junie Lau.
Το Veo 3 είναι διαθέσιμο αυτή τη στιγμή σε συνδρομητές του προγράμματος AI Ultra της Google, αξίας $249,99 το μήνα, μέσω της εφαρμογής Gemini στις ΗΠΑ, καθώς και σε εταιρικούς χρήστες μέσω της πλατφόρμας Vertex AI. Η τεχνολογία περιλαμβάνει υδατογράφημα SynthID για την αναγνώριση περιεχομένου που παράγεται από AI και την αντιμετώπιση ανησυχιών σχετικά με deepfakes και παραπληροφόρηση.