menu
close

Google zlepšuje prístupnosť Androidu integráciou Gemini AI

Google predstavil významné vylepšenia prístupnosti poháňané umelou inteligenciou pre Android a Chrome, pričom najvýraznejšou novinkou je integrácia Gemini do čítačky TalkBack. Aktualizácia umožňuje zrakovo znevýhodneným používateľom nielen prijímať AI-generované popisy obrázkov, ale aj klásť doplňujúce otázky k obrázkom a obsahu obrazovky. Táto inovácia, dostupná na zariadeniach s Androidom 15 vo vybraných anglicky hovoriacich krajinách, predstavuje významný krok smerom k inkluzívnejším technológiám.
Google zlepšuje prístupnosť Androidu integráciou Gemini AI

Spoločnosť Google vo štvrtok 15. mája 2025 oznámila balík vylepšení prístupnosti poháňaných umelou inteligenciou pre Android a Chrome, ktoré výrazne zlepšujú digitálnu skúsenosť používateľov so zrakovým postihnutím.

Najvýraznejšia aktualizácia sa týka čítačky obrazovky TalkBack, ktorá teraz využíva Gemini AI na poskytovanie interaktívnej asistencie. Kým TalkBack už predtým ponúkal AI-generované popisy obrázkov v prípade chýbajúceho alternatívneho textu, používatelia sa teraz môžu pýtať konkrétne otázky o obrázkoch a dostávať podrobné odpovede. Napríklad, ak niekto dostane fotografiu gitary, môže sa opýtať na jej značku, farbu či ďalšie detaily. Táto funkcionalita sa rozširuje aj na celé obrazovky, čo umožňuje používateľom pýtať sa na materiály produktov alebo dostupné zľavy pri online nakupovaní.

Google zároveň vylepšil funkciu Expressive Captions, ktorá teraz zachytáva nielen to, čo ľudia hovoria, ale aj spôsob, akým to hovoria. Nová funkcia rozpoznávania dĺžky slov identifikuje predĺžené výrazy ako „amaaazing“ alebo „nooooo“, čím lepšie sprostredkuje emócie a dôraz. Ďalšie zvukové označenia, napríklad pre pískanie alebo odkašľanie, ešte viac obohacujú zážitok z titulkovania. Táto aktualizácia sa zavádza v angličtine v USA, Spojenom kráľovstve, Kanade a Austrálii pre zariadenia s Androidom 15 a vyšším.

Pre používateľov prehliadača Chrome Google predstavil technológiu optického rozpoznávania znakov (OCR), ktorá automaticky spracováva skenované PDF dokumenty. Vďaka tomu môžu čítačky obrazovky pracovať s predtým neprístupnými dokumentmi, pričom používatelia môžu zvýrazňovať, kopírovať a vyhľadávať text rovnako ako na bežných webových stránkach. Navyše Chrome pre Android teraz ponúka funkciu Page Zoom, ktorá zväčšuje veľkosť textu bez narušenia rozloženia webových stránok.

Tieto inovácie ukazujú, ako možno umelú inteligenciu využiť na tvorbu inkluzívnejších technológií. Priamo integrovaním schopností Gemini do nástrojov prístupnosti Google odstraňuje významné bariéry, ktorým čelia zrakovo znevýhodnení používatelia – podľa výskumu Googlu denne narazia v priemere na 90 neoznačených obrázkov. Spoločnosť naďalej rozširuje svoje iniciatívy v oblasti prístupnosti, vrátane sprístupnenia zdrojov projektu Euphonia pre vývojárov na tvorbu nástrojov rozpoznávania reči pre rôznorodé rečové vzory.

Source:

Latest News