menu
close

Google renforce l’accessibilité d’Android grâce à l’intégration de Gemini AI

Google a déployé d’importantes améliorations d’accessibilité alimentées par l’IA sur Android et Chrome, avec l’intégration de Gemini dans TalkBack comme fonctionnalité phare. Cette mise à jour permet aux utilisateurs malvoyants de bénéficier non seulement de descriptions d’images générées par l’IA, mais aussi de poser des questions de suivi sur les images et le contenu affiché à l’écran. Disponible sur les appareils Android 15 dans certains pays anglophones, cette avancée marque une étape majeure vers une technologie plus inclusive.
Google renforce l’accessibilité d’Android grâce à l’intégration de Gemini AI

Google a annoncé, jeudi 15 mai 2025, une série d’améliorations d’accessibilité basées sur l’IA pour Android et Chrome, améliorant considérablement l’expérience numérique des utilisateurs malvoyants.

La nouveauté la plus marquante concerne TalkBack, le lecteur d’écran d’Android, qui exploite désormais Gemini AI pour offrir une assistance interactive. Alors que TalkBack proposait déjà des descriptions d’images générées par l’IA en l’absence de texte alternatif, les utilisateurs peuvent désormais poser des questions précises sur les images et recevoir des réponses détaillées. Par exemple, si une personne reçoit la photo d’une guitare, elle peut demander la marque, la couleur ou d’autres détails. Cette fonctionnalité s’étend au-delà des images individuelles à l’ensemble de l’écran, permettant aux utilisateurs d’interroger les matériaux d’un produit ou les promotions disponibles lors de leurs achats.

Google a également enrichi sa fonction Expressive Captions, qui retranscrit désormais non seulement ce que les gens disent, mais aussi la manière dont ils le disent. La nouvelle fonctionnalité de durée reconnaît les mots allongés comme « amaaazing » ou « nooooo » afin de mieux restituer l’émotion et l’accentuation. Des étiquettes sonores supplémentaires pour des actions telles que siffler ou se racler la gorge viennent encore enrichir l’expérience de sous-titrage. Cette mise à jour est en cours de déploiement en anglais aux États-Unis, au Royaume-Uni, au Canada et en Australie sur les appareils équipés d’Android 15 et versions ultérieures.

Pour les utilisateurs de Chrome, Google a introduit une technologie de reconnaissance optique de caractères (OCR) qui traite automatiquement les PDF numérisés. Cette avancée permet aux lecteurs d’écran d’interagir avec des documents auparavant inaccessibles, offrant la possibilité de surligner, copier et rechercher du texte comme sur n’importe quelle page web classique. De plus, Chrome pour Android propose désormais un zoom de page, qui augmente la taille du texte sans perturber la mise en page des sites.

Ces innovations illustrent comment l’IA peut être exploitée pour rendre la technologie plus inclusive. En intégrant directement les capacités de Gemini dans les outils d’accessibilité, Google s’attaque à des obstacles majeurs rencontrés par les personnes malvoyantes, qui, selon les recherches de Google, sont confrontées en moyenne à 90 images non étiquetées par jour. L’entreprise continue d’élargir ses initiatives en matière d’accessibilité, notamment en ouvrant les ressources de son projet Euphonia pour aider les développeurs à créer des outils de reconnaissance vocale adaptés à une grande diversité de profils de parole.

Source:

Latest News