Na konferenci Google I/O 2025 představila technologická společnost zásadní inovaci v oblasti komunikace: simultánní hlasový překlad v Google Meet, který funguje jako lidský tlumočník přímo ve videohovorech.
Na rozdíl od tradičních překladových nástrojů, které spoléhají na titulky nebo syntetické hlasy, nová funkce Googlu provádí přímou transformaci zvuku na zvuk. Po aktivaci systém překládá mluvená slova do preferovaného jazyka posluchače a zároveň zachovává původní charakteristiky hlasu mluvčího, včetně tónu, intonace a emocionálního zabarvení. Uživatelé slyší slabě původní řeč s překryvem přeložené verze, což vytváří autentický zážitek z konverzace.
„Funkce využívá robustní jazykový audio model vyvinutý Google DeepMind, který umožňuje plynulé a přirozené rozhovory mezi lidmi hovořícími různými jazyky,“ uvedl Google během prezentace na I/O. Technologie staví na systému AudioLM, jenž je trénován na zvukových datech tak, aby při převodu jazyka zachoval co nejvyšší kvalitu původního audia.
Funkce je nyní v betaverzi dostupná pro předplatitele Google AI Pro (19,99 USD/měsíc) a nově spuštěného AI Ultra (249,99 USD/měsíc). Klíčové je, že pro fungování překladu stačí, aby měl předplatné pouze jeden účastník hovoru. Zpočátku je podporována angličtina a španělština, v následujících týdnech přibude italština, němčina a portugalština.
Možnosti využití jsou široké – od umožnění přirozené konverzace mezi anglicky mluvícími vnoučaty a španělsky mluvícími prarodiči až po zjednodušení mezinárodní firemní spolupráce. Google potvrdil, že testování pro firemní zákazníky Workspace začne ještě letos, což může zásadně změnit globální firemní komunikaci.
Tento krok představuje významný posun oproti konkurenčním řešením. Zatímco Microsoft Teams a Skype již v minulosti překladové funkce nabízely, přístup Googlu přináší plynulejší a přirozenější zážitek, který zachovává lidský rozměr konverzace – klíčový pokrok v překonávání globálních jazykových bariér.