في مؤتمر Google I/O 2025، كشفت عملاقة التقنية عن تقدم ثوري في تكنولوجيا التواصل: الترجمة الصوتية الفورية في Google Meet، التي تعمل كما لو كان هناك مترجم بشري في مكالمات الفيديو الخاصة بك.
على عكس أدوات الترجمة التقليدية التي تعتمد على النصوص أو الأصوات الاصطناعية، تقدم الميزة الجديدة من Google تحويلات صوتية مباشرة من لغة إلى أخرى. عند تفعيلها، تقوم المنظومة بترجمة الكلمات المنطوقة إلى اللغة المفضلة لدى المستمع، مع الحفاظ على خصائص صوت المتحدث الأصلية، بما في ذلك النبرة، والتنغيم، والتعبيرات العاطفية. يسمع المستخدمون نسخة خافتة من الصوت الأصلي مع الترجمة الصوتية فوقها، ما يخلق تجربة محادثة واقعية.
قالت Google خلال العرض التقديمي في I/O: "تستخدم الميزة نموذجاً صوتياً لغوياً متقدماً تم تطويره بواسطة Google DeepMind، ما يتيح محادثات سلسة وطبيعية بين أشخاص يتحدثون لغات مختلفة". وتعتمد التقنية على AudioLM، الذي تم تدريبه على بيانات صوتية للحفاظ على جودة الصوت الأصلية قدر الإمكان أثناء تحويل اللغة.
الميزة متاحة حالياً بنسخة تجريبية لمشتركي Google AI Pro (19.99 دولار شهرياً) وAI Ultra (249.99 دولار شهرياً). والأهم أنه يكفي أن يكون أحد المشاركين في المكالمة مشتركاً للاستفادة من الترجمة لجميع الحضور. تدعم الميزة حالياً الإنجليزية والإسبانية، وتخطط Google لإضافة الإيطالية والألمانية والبرتغالية خلال الأسابيع القادمة.
تشمل التطبيقات العملية لهذه التقنية تمكين الأحفاد الناطقين بالإنجليزية من التحدث بشكل طبيعي مع أجدادهم الناطقين بالإسبانية، بالإضافة إلى تسهيل التعاون الدولي في قطاع الأعمال. وأكدت Google أن الاختبارات الأولية لعملاء Workspace من قطاع الأعمال ستبدأ في وقت لاحق من هذا العام، ما قد يحدث تحولاً في التواصل المؤسسي العالمي.
يمثل هذا التطور قفزة نوعية مقارنة بما يقدمه المنافسون. فعلى الرغم من أن Microsoft Teams وSkype قدما ميزات ترجمة في السابق، إلا أن نهج Google يوفر تجربة أكثر سلاسة وطبيعية مع الحفاظ على العنصر البشري في المحادثة — وهو تقدم جوهري في إزالة حواجز اللغة على مستوى العالم.