menu
close

Google ने Gemini AI इंटीग्रेशन के साथ Android की एक्सेसिबिलिटी को बढ़ाया

Google ने Android और Chrome के लिए AI-संचालित एक्सेसिबिलिटी फीचर्स जारी किए हैं, जिनमें TalkBack में Gemini का इंटीग्रेशन सबसे खास है। इस अपडेट से दृष्टिबाधित यूजर्स को न सिर्फ AI-जनित इमेज डिस्क्रिप्शन मिलेंगे, बल्कि वे इमेज और स्क्रीन कंटेंट के बारे में फॉलो-अप सवाल भी पूछ सकते हैं। यह सुविधा चुनिंदा अंग्रेज़ी-भाषी देशों में Android 15 डिवाइसेज़ के लिए उपलब्ध है और समावेशी तकनीक की दिशा में एक बड़ा कदम है।
Google ने Gemini AI इंटीग्रेशन के साथ Android की एक्सेसिबिलिटी को बढ़ाया

गूगल ने गुरुवार, 15 मई 2025 को Android और Chrome के लिए AI-आधारित एक्सेसिबिलिटी सुधारों की घोषणा की, जिससे दृष्टिबाधित यूजर्स के लिए डिजिटल अनुभव काफी बेहतर हो गया है।

सबसे महत्वपूर्ण अपडेट Android के स्क्रीन रीडर TalkBack में आया है, जो अब Gemini AI की मदद से इंटरैक्टिव असिस्टेंस प्रदान करता है। पहले TalkBack तब AI-जनित इमेज डिस्क्रिप्शन देता था जब alt टेक्स्ट उपलब्ध नहीं होता था, लेकिन अब यूजर्स इमेज के बारे में विशेष सवाल पूछ सकते हैं और विस्तृत जवाब प्राप्त कर सकते हैं। उदाहरण के लिए, अगर किसी को गिटार की फोटो मिलती है, तो वे उसके ब्रांड, रंग या अन्य डिटेल्स के बारे में पूछ सकते हैं। यह सुविधा सिर्फ एकल इमेज तक सीमित नहीं है, बल्कि पूरी स्क्रीन पर भी लागू होती है, जिससे यूजर्स शॉपिंग के दौरान प्रोडक्ट के मटेरियल या उपलब्ध छूट के बारे में भी सवाल कर सकते हैं।

Google ने अपने Expressive Captions फीचर को भी बेहतर बनाया है, जो अब सिर्फ यह नहीं बताता कि लोग क्या बोल रहे हैं, बल्कि यह भी दर्शाता है कि वे कैसे बोल रहे हैं। नया ड्यूरेशन फीचर लंबे शब्दों जैसे "अमेज़िंग" या "नूूूू" को पहचानता है, जिससे भावना और ज़ोर को बेहतर तरीके से दर्शाया जा सके। इसके अलावा, सीटी बजाने या गला साफ़ करने जैसी क्रियाओं के लिए अतिरिक्त साउंड लेबल्स भी जोड़े गए हैं, जिससे कैप्शनिंग अनुभव और समृद्ध हो गया है। यह अपडेट Android 15 और उससे ऊपर के डिवाइसेज़ के लिए अमेरिका, यूके, कनाडा और ऑस्ट्रेलिया में अंग्रेज़ी में जारी किया जा रहा है।

Chrome यूजर्स के लिए, Google ने ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) तकनीक पेश की है, जो स्कैन किए गए PDF को अपने आप प्रोसेस करती है। इस सुधार से स्क्रीन रीडर पहले से पहुंच से बाहर रहे डॉक्युमेंट्स के साथ इंटरैक्ट कर सकते हैं, जिससे यूजर्स टेक्स्ट को हाइलाइट, कॉपी और सर्च कर सकते हैं, जैसे वे किसी भी सामान्य वेबपेज पर करते हैं। इसके अलावा, Chrome for Android में अब Page Zoom फीचर भी है, जिससे वेबपेज के लेआउट को बिगाड़े बिना टेक्स्ट का आकार बढ़ाया जा सकता है।

ये सभी विकास दिखाते हैं कि AI का उपयोग समावेशी तकनीक बनाने के लिए कैसे किया जा सकता है। Gemini की क्षमताओं को सीधे एक्सेसिबिलिटी टूल्स में जोड़कर, Google दृष्टिबाधित यूजर्स के सामने आने वाली बड़ी चुनौतियों को दूर कर रहा है—Google के शोध के अनुसार, ऐसे यूजर्स को रोज़ाना औसतन 90 बिना लेबल वाली इमेज का सामना करना पड़ता है। कंपनी अपनी एक्सेसिबिलिटी पहलों का विस्तार कर रही है, जिसमें Project Euphonia के संसाधन डेवलपर्स के लिए खोलना भी शामिल है, ताकि वे विविध बोलचाल के पैटर्न के लिए स्पीच रिकग्निशन टूल्स बना सकें।

Source:

Latest News