På Google I/O 2025 presenterade teknikjätten ett revolutionerande framsteg inom kommunikationsteknik: realtidsöversättning av tal i Google Meet som fungerar som om en mänsklig tolk deltog i dina videosamtal.
Till skillnad från traditionella översättningsverktyg som förlitar sig på textremsor eller robotliknande röster, utför Googles nya funktion direkta ljud-till-ljud-översättningar. När funktionen är aktiverad översätts det talade språket till lyssnarens föredragna språk, samtidigt som talarens ursprungliga röstkaraktär, inklusive ton, intonation och känslouttryck, bevaras. Användarna hör en svag version av originaltalet med den översatta versionen ovanpå, vilket skapar en autentisk samtalsupplevelse.
"Funktionen använder en robust ljudmodell för språk utvecklad av Google DeepMind, vilket möjliggör sömlösa och naturliga samtal mellan personer som talar olika språk," uppgav Google under I/O-presentationen. Tekniken bygger på AudioLM, som tränats på ljuddata för att bibehålla så mycket som möjligt av den ursprungliga ljudkvaliteten samtidigt som språket omvandlas.
Funktionen rullas nu ut i beta till prenumeranter på Google AI Pro (19,99 USD/månad) och den nylanserade AI Ultra (249,99 USD/månad). Viktigt är att endast en deltagare i samtalet behöver en prenumeration för att översättningen ska fungera för alla. Inledningsvis stöds engelska och spanska, men Google planerar att lägga till italienska, tyska och portugisiska under de kommande veckorna.
De praktiska användningsområdena är många, från att möjliggöra naturliga samtal mellan engelsktalande barnbarn och spansktalande mor- och farföräldrar till att underlätta smidigt internationellt affärssamarbete. Google bekräftar att tidiga tester för Workspace-företagskunder kommer att inledas senare i år, vilket potentiellt kan förändra global företagskommunikation.
Denna utveckling innebär ett betydande steg förbi konkurrenternas erbjudanden. Medan Microsoft Teams och Skype tidigare erbjudit översättningsfunktioner, levererar Googles lösning en mer flytande och naturlig upplevelse som bevarar det mänskliga i samtalet – ett avgörande framsteg för att riva globala språkbarriärer.