menu
close

Google verbessert Barrierefreiheit von Android durch Integration von Gemini AI

Google hat bedeutende KI-gestützte Verbesserungen für die Barrierefreiheit in Android und Chrome eingeführt, wobei die Integration von Gemini in TalkBack besonders hervorsticht. Das Update ermöglicht es sehbehinderten Nutzerinnen und Nutzern, nicht nur KI-generierte Bildbeschreibungen zu erhalten, sondern auch gezielte Rückfragen zu Bildern und Bildschirminhalten zu stellen. Diese Neuerung, die auf Geräten mit Android 15 in ausgewählten englischsprachigen Ländern verfügbar ist, stellt einen wichtigen Schritt hin zu inklusiverer Technologie dar.
Google verbessert Barrierefreiheit von Android durch Integration von Gemini AI

Am Donnerstag, den 15. Mai 2025, hat Google eine Reihe von KI-gestützten Verbesserungen für die Barrierefreiheit in Android und Chrome angekündigt, die das digitale Erlebnis für Menschen mit Sehbehinderung deutlich verbessern.

Die bedeutendste Neuerung betrifft TalkBack, den Screenreader von Android, der nun auf Gemini AI setzt, um interaktive Unterstützung zu bieten. Während TalkBack bislang KI-generierte Bildbeschreibungen lieferte, wenn kein Alternativtext vorhanden war, können Nutzerinnen und Nutzer nun gezielte Fragen zu Bildern stellen und erhalten detaillierte Antworten. So kann beispielsweise bei einem Foto einer Gitarre nach Marke, Farbe oder anderen Details gefragt werden. Diese Funktionalität geht über einzelne Bilder hinaus und erstreckt sich auf ganze Bildschirminhalte – etwa beim Online-Shopping, wo Fragen zu Produktmaterialien oder verfügbaren Rabatten gestellt werden können.

Auch die Funktion Expressive Captions wurde verbessert: Sie erfasst nun nicht nur, was gesagt wird, sondern auch, wie es gesagt wird. Das neue Dauer-Feature erkennt gedehnte Wörter wie „amaaaazing“ oder „nooooo“, um Emotionen und Betonungen besser wiederzugeben. Zusätzliche Sound-Labels für Aktionen wie Pfeifen oder Räuspern bereichern das Untertitel-Erlebnis weiter. Dieses Update wird in englischer Sprache in den USA, Großbritannien, Kanada und Australien für Geräte mit Android 15 und höher ausgerollt.

Für Chrome-Nutzerinnen und -Nutzer hat Google eine optische Zeichenerkennung (OCR) eingeführt, die gescannte PDFs automatisch verarbeitet. Dadurch können Screenreader erstmals mit zuvor unzugänglichen Dokumenten interagieren, sodass Nutzerinnen und Nutzer Text wie auf einer normalen Webseite markieren, kopieren und durchsuchen können. Außerdem bietet Chrome für Android nun die Funktion Page Zoom, mit der sich die Textgröße erhöhen lässt, ohne das Layout der Webseite zu beeinträchtigen.

Diese Entwicklungen zeigen, wie KI genutzt werden kann, um inklusivere Technologien zu schaffen. Durch die direkte Integration der Gemini-Funktionen in Barrierefreiheits-Tools adressiert Google zentrale Hürden, mit denen sehbehinderte Menschen konfrontiert sind – laut Google-Forschung begegnen sie im Schnitt täglich 90 nicht beschrifteten Bildern. Das Unternehmen baut seine Barrierefreiheitsinitiativen weiter aus, etwa durch die Öffnung der Project-Euphonia-Ressourcen, die Entwicklerinnen und Entwicklern beim Aufbau von Spracherkennungstools für vielfältige Sprachmuster unterstützen.

Source:

Latest News