गूगल ने गुरुवार, 15 मई 2025 को Android और Chrome के लिए AI-आधारित एक्सेसिबिलिटी सुधारों की घोषणा की, जिससे दृष्टिबाधित यूजर्स के लिए डिजिटल अनुभव काफी बेहतर हो गया है।
सबसे महत्वपूर्ण अपडेट Android के स्क्रीन रीडर TalkBack में आया है, जो अब Gemini AI की मदद से इंटरैक्टिव असिस्टेंस प्रदान करता है। पहले TalkBack तब AI-जनित इमेज डिस्क्रिप्शन देता था जब alt टेक्स्ट उपलब्ध नहीं होता था, लेकिन अब यूजर्स इमेज के बारे में विशेष सवाल पूछ सकते हैं और विस्तृत जवाब प्राप्त कर सकते हैं। उदाहरण के लिए, अगर किसी को गिटार की फोटो मिलती है, तो वे उसके ब्रांड, रंग या अन्य डिटेल्स के बारे में पूछ सकते हैं। यह सुविधा सिर्फ एकल इमेज तक सीमित नहीं है, बल्कि पूरी स्क्रीन पर भी लागू होती है, जिससे यूजर्स शॉपिंग के दौरान प्रोडक्ट के मटेरियल या उपलब्ध छूट के बारे में भी सवाल कर सकते हैं।
Google ने अपने Expressive Captions फीचर को भी बेहतर बनाया है, जो अब सिर्फ यह नहीं बताता कि लोग क्या बोल रहे हैं, बल्कि यह भी दर्शाता है कि वे कैसे बोल रहे हैं। नया ड्यूरेशन फीचर लंबे शब्दों जैसे "अमेज़िंग" या "नूूूू" को पहचानता है, जिससे भावना और ज़ोर को बेहतर तरीके से दर्शाया जा सके। इसके अलावा, सीटी बजाने या गला साफ़ करने जैसी क्रियाओं के लिए अतिरिक्त साउंड लेबल्स भी जोड़े गए हैं, जिससे कैप्शनिंग अनुभव और समृद्ध हो गया है। यह अपडेट Android 15 और उससे ऊपर के डिवाइसेज़ के लिए अमेरिका, यूके, कनाडा और ऑस्ट्रेलिया में अंग्रेज़ी में जारी किया जा रहा है।
Chrome यूजर्स के लिए, Google ने ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) तकनीक पेश की है, जो स्कैन किए गए PDF को अपने आप प्रोसेस करती है। इस सुधार से स्क्रीन रीडर पहले से पहुंच से बाहर रहे डॉक्युमेंट्स के साथ इंटरैक्ट कर सकते हैं, जिससे यूजर्स टेक्स्ट को हाइलाइट, कॉपी और सर्च कर सकते हैं, जैसे वे किसी भी सामान्य वेबपेज पर करते हैं। इसके अलावा, Chrome for Android में अब Page Zoom फीचर भी है, जिससे वेबपेज के लेआउट को बिगाड़े बिना टेक्स्ट का आकार बढ़ाया जा सकता है।
ये सभी विकास दिखाते हैं कि AI का उपयोग समावेशी तकनीक बनाने के लिए कैसे किया जा सकता है। Gemini की क्षमताओं को सीधे एक्सेसिबिलिटी टूल्स में जोड़कर, Google दृष्टिबाधित यूजर्स के सामने आने वाली बड़ी चुनौतियों को दूर कर रहा है—Google के शोध के अनुसार, ऐसे यूजर्स को रोज़ाना औसतन 90 बिना लेबल वाली इमेज का सामना करना पड़ता है। कंपनी अपनी एक्सेसिबिलिटी पहलों का विस्तार कर रही है, जिसमें Project Euphonia के संसाधन डेवलपर्स के लिए खोलना भी शामिल है, ताकि वे विविध बोलचाल के पैटर्न के लिए स्पीच रिकग्निशन टूल्स बना सकें।