Google presenterade på torsdagen den 15 maj 2025 en rad AI-baserade tillgänglighetsförbättringar för Android och Chrome, vilket avsevärt förbättrar den digitala upplevelsen för användare med synnedsättning.
Den mest anmärkningsvärda uppdateringen gäller TalkBack, Androids skärmläsare, som nu använder Gemini AI för att erbjuda interaktiv assistans. Tidigare kunde TalkBack generera AI-baserade bildbeskrivningar när alt-text saknades, men nu kan användare även ställa specifika frågor om bilder och få detaljerade svar. Om någon till exempel får ett foto på en gitarr kan de fråga om dess märke, färg eller andra detaljer. Denna funktionalitet gäller inte bara enskilda bilder utan hela skärmar, så att användare kan fråga om exempelvis produktmaterial eller tillgängliga rabatter vid online-shopping.
Google har även förbättrat sin funktion Expressive Captions, som nu fångar inte bara vad folk säger utan även hur de säger det. Den nya varaktighetsfunktionen känner igen utdragna ord som "amaaaazing" eller "nooooo" för att bättre förmedla känsla och betoning. Ytterligare ljudetiketter för handlingar som visslingar eller harklingar gör textningen ännu mer uttrycksfull. Denna uppdatering rullas ut på engelska i USA, Storbritannien, Kanada och Australien för enheter med Android 15 och senare.
För Chrome-användare har Google introducerat optisk teckenigenkänning (OCR) som automatiskt bearbetar inskannade PDF-filer. Detta gör det möjligt för skärmläsare att interagera med tidigare otillgängliga dokument, så att användare kan markera, kopiera och söka efter text precis som på vanliga webbsidor. Dessutom har Chrome för Android nu funktionen Page Zoom, som förstorar text utan att förstöra sidans layout.
Dessa framsteg visar hur AI kan användas för att skapa mer inkluderande teknik. Genom att integrera Geminis funktioner direkt i tillgänglighetsverktyg adresserar Google betydande hinder för synskadade användare, som enligt Googles forskning i genomsnitt stöter på 90 oetiketterade bilder varje dag. Företaget fortsätter att utöka sina tillgänglighetsinitiativ, bland annat genom att öppna sitt Project Euphonia-resurser för att hjälpa utvecklare bygga taligenkänningsverktyg för olika talmönster.