Στο Google I/O 2025, ο τεχνολογικός κολοσσός αποκάλυψε μια επαναστατική εξέλιξη στην τεχνολογία επικοινωνίας: ζωντανή μετάφραση ομιλίας στο Google Meet που λειτουργεί σαν να έχετε έναν ανθρώπινο διερμηνέα στις βιντεοκλήσεις σας.
Σε αντίθεση με τα παραδοσιακά εργαλεία μετάφρασης που βασίζονται σε υπότιτλους ή ρομποτικές φωνές, η νέα λειτουργία της Google πραγματοποιεί άμεσες μετατροπές ήχου σε ήχο. Όταν ενεργοποιείται, το σύστημα μεταφράζει τα λόγια του ομιλητή στη γλώσσα προτίμησης του ακροατή, διατηρώντας ταυτόχρονα τα χαρακτηριστικά της αρχικής φωνής, όπως ο τόνος, η προσωδία και οι συναισθηματικές εκφράσεις. Οι χρήστες ακούν μια χαμηλή εκδοχή της αρχικής ομιλίας με τη μεταφρασμένη εκδοχή να επικαλύπτεται, προσφέροντας μια αυθεντική εμπειρία συνομιλίας.
«Η λειτουργία αξιοποιεί ένα ισχυρό γλωσσικό μοντέλο ήχου που ανέπτυξε η Google DeepMind, επιτρέποντας αβίαστες και φυσικές συνομιλίες μεταξύ ατόμων που μιλούν διαφορετικές γλώσσες», ανέφερε η Google κατά την παρουσίαση στο I/O. Η τεχνολογία βασίζεται στο AudioLM, το οποίο εκπαιδεύεται σε ηχητικά δεδομένα ώστε να διατηρεί όσο το δυνατόν περισσότερη από την αρχική ποιότητα του ήχου κατά τη μετατροπή της γλώσσας.
Η λειτουργία διατίθεται ήδη σε beta στους συνδρομητές Google AI Pro (19,99 δολάρια/μήνα) και στο νέο AI Ultra (249,99 δολάρια/μήνα). Σημαντικό είναι ότι μόνο ένας συμμετέχων στην κλήση χρειάζεται να έχει συνδρομή για να λειτουργήσει η μετάφραση για όλους. Αρχικά υποστηρίζονται αγγλικά και ισπανικά, ενώ η Google σχεδιάζει να προσθέσει ιταλικά, γερμανικά και πορτογαλικά τις επόμενες εβδομάδες.
Οι πρακτικές εφαρμογές είναι εκτεταμένες: από το να μπορούν εγγόνια που μιλούν αγγλικά να συνομιλούν φυσικά με παππούδες που μιλούν ισπανικά, μέχρι τη διευκόλυνση της διεθνούς επιχειρηματικής συνεργασίας. Η Google επιβεβαίωσε ότι οι πρώτες δοκιμές για επιχειρησιακούς πελάτες του Workspace θα ξεκινήσουν αργότερα μέσα στη χρονιά, με την προοπτική να μεταμορφωθεί η παγκόσμια εταιρική επικοινωνία.
Η εξέλιξη αυτή αποτελεί σημαντικό άλμα σε σχέση με τις προσφορές των ανταγωνιστών. Ενώ το Microsoft Teams και το Skype έχουν προσφέρει λειτουργίες μετάφρασης στο παρελθόν, η προσέγγιση της Google προσφέρει μια πιο ομαλή, φυσική εμπειρία που διατηρεί το ανθρώπινο στοιχείο της συνομιλίας — μια κρίσιμη πρόοδος στην κατάργηση των παγκόσμιων γλωσσικών εμποδίων.