menu
close

Google усиливает доступность Android с помощью интеграции Gemini AI

Google внедрила значительные улучшения доступности на базе искусственного интеллекта для Android и Chrome, главным из которых стала интеграция Gemini в TalkBack. Теперь пользователи с нарушениями зрения могут не только получать AI-описания изображений, но и задавать уточняющие вопросы о содержимом экрана. Это обновление, доступное на устройствах с Android 15 в некоторых англоязычных странах, стало важным шагом к созданию более инклюзивных технологий.
Google усиливает доступность Android с помощью интеграции Gemini AI

15 мая 2025 года компания Google анонсировала комплекс улучшений доступности на базе искусственного интеллекта для Android и Chrome, значительно расширяющих цифровые возможности для пользователей с нарушениями зрения.

Главное обновление получило TalkBack — экранный диктор для Android, который теперь использует Gemini AI для интерактивной помощи. Если раньше TalkBack автоматически генерировал описания изображений при отсутствии alt-текста, то теперь пользователи могут задавать конкретные вопросы о картинках и получать подробные ответы. Например, получив фотографию гитары, пользователь может узнать её марку, цвет или другие детали. Эта функция распространяется не только на отдельные изображения, но и на целые экраны: во время онлайн-шопинга можно спросить о материалах товара или доступных скидках.

Google также усовершенствовала функцию Expressive Captions, которая теперь фиксирует не только то, что говорят люди, но и как они это делают. Новый параметр длительности распознаёт растянутые слова вроде «ооочень» или «нееет», чтобы точнее передавать эмоции и акценты. Дополнительные звуковые метки, например, для свиста или покашливания, делают субтитры ещё более выразительными. Обновление распространяется на устройства с Android 15 и выше в США, Великобритании, Канаде и Австралии для английского языка.

Для пользователей Chrome Google внедрила технологию оптического распознавания символов (OCR), которая автоматически обрабатывает отсканированные PDF-файлы. Благодаря этому экранные дикторы могут работать с ранее недоступными документами, позволяя выделять, копировать и искать текст так же, как на обычных веб-страницах. Кроме того, в Chrome для Android появилась функция Page Zoom, увеличивающая размер текста без нарушения структуры страницы.

Эти нововведения демонстрируют, как искусственный интеллект помогает создавать более инклюзивные технологии. Интегрируя возможности Gemini непосредственно в инструменты доступности, Google устраняет серьёзные барьеры для людей с нарушениями зрения, которые, по данным компании, ежедневно сталкиваются в среднем с 90 неописанными изображениями. Компания продолжает развивать инициативы по доступности, в том числе открывая ресурсы проекта Project Euphonia для помощи разработчикам в создании инструментов распознавания речи для различных типов произношения.

Source:

Latest News