Podczas Google I/O 2025 technologiczny gigant zaprezentował rewolucyjny postęp w komunikacji: tłumaczenie mowy w czasie rzeczywistym w Google Meet, które działa niczym ludzki tłumacz obecny na wideorozmowie.
W przeciwieństwie do tradycyjnych narzędzi tłumaczeniowych, które opierają się na napisach lub syntetycznych głosach, nowa funkcja Google realizuje bezpośrednią transformację audio-na-audio. Po jej uruchomieniu system tłumaczy wypowiedzi na preferowany przez słuchacza język, zachowując przy tym oryginalne cechy głosu mówcy, w tym ton, intonację oraz emocjonalną ekspresję. Użytkownicy słyszą delikatnie przytłumioną wersję oryginalnej wypowiedzi z nałożonym tłumaczeniem, co zapewnia autentyczne wrażenia konwersacyjne.
„Funkcja wykorzystuje zaawansowany model językowy audio opracowany przez Google DeepMind, umożliwiając płynne i naturalne rozmowy między osobami mówiącymi w różnych językach” – przekazało Google podczas prezentacji na I/O. Technologia bazuje na AudioLM, trenowanym na danych dźwiękowych, by jak najwierniej zachować oryginalną jakość audio przy zmianie języka.
Obecnie funkcja jest wdrażana w wersji beta dla subskrybentów Google AI Pro (19,99 USD/miesiąc) oraz nowo uruchomionego AI Ultra (249,99 USD/miesiąc). Co istotne, tylko jeden uczestnik rozmowy musi posiadać subskrypcję, aby tłumaczenie działało dla wszystkich. Początkowo obsługiwane są języki angielski i hiszpański, a w najbliższych tygodniach Google planuje dodać włoski, niemiecki i portugalski.
Zastosowania praktyczne są bardzo szerokie – od umożliwienia wnukom mówiącym po angielsku naturalnej rozmowy z hiszpańskojęzycznymi dziadkami, po usprawnienie międzynarodowej współpracy biznesowej. Google potwierdziło, że jeszcze w tym roku rozpocznie się wczesne testowanie funkcji dla klientów biznesowych Workspace, co może zrewolucjonizować komunikację korporacyjną na całym świecie.
To osiągnięcie stanowi znaczący krok naprzód względem rozwiązań konkurencji. Podczas gdy Microsoft Teams i Skype oferowały już funkcje tłumaczenia, podejście Google zapewnia bardziej płynne i naturalne doświadczenie, zachowując ludzki wymiar rozmowy – kluczowy element w przełamywaniu globalnych barier językowych.