Первая неделя июля 2025 года ознаменовалась значительным прорывом в области искусственного интеллекта и робототехники: исследователи продемонстрировали машины с беспрецедентными способностями предугадывать движения и адаптировать стратегии в динамичных условиях.
В центре этого достижения — ANYmal-D, четвероногий робот, разработанный в ETH Zurich, который способен автономно играть в бадминтон с человеческими соперниками. Робот использует инновационную систему управления на основе обучения с подкреплением, что позволяет ему отслеживать, предсказывать и мастерски возвращать воланы. Его сложный «мозг» даёт возможность следить за траекторией волана, предугадывать его путь и быстро перемещаться по корту для перехвата и возврата. Это достижение, подробно описанное в журнале Science Robotics, демонстрирует потенциал применения шагающих роботов в динамических задачах, требующих точного восприятия и быстрых, скоординированных движений всего тела.
Робот оснащён стереокамерой для визуального восприятия и динамичной рукой для управления ракеткой, что требует точной синхронизации между восприятием, передвижением и движениями руки. Исследователи обучали систему с помощью обучения с подкреплением, позволяя роботу вырабатывать эффективные стратегии через эксперименты и взаимодействие с окружающей средой. В тестах против человеческих игроков ANYmal-D продемонстрировал способность эффективно перемещаться по корту, возвращать удары на разной скорости и под разными углами, а также поддерживать розыгрыши до 10 последовательных ударов.
Этот прорыв — не просто технологическое любопытство. Четвероногий робот использует зрение, данные с датчиков и машинное обучение для предугадывания движений и корректировки своей стратегии, демонстрируя будущее сотрудничества человека и робота в спорте и обучении. Проект сочетает физическую робототехнику с продвинутым ИИ-мышлением, открывая новые возможности для машин, способных работать вместе с людьми в сложных, непредсказуемых условиях.
Робототехники добились значительных успехов в том, как роботы учатся и адаптируются. Одним из ключевых достижений стало объединение различных типов данных для их использования роботами. Например, исследователи могут собирать данные с людей, выполняющих задачи с датчиками, объединять их с данными телеоперации, когда человек управляет роботизированной рукой, и дополнять интернет-изображениями и видео с аналогичными действиями. Объединяя эти источники в новые ИИ-модели, роботы получают огромное преимущество по сравнению с обучением традиционными методами. Видя несколько способов выполнения одной задачи, ИИ-модели легче импровизировать и выбирать подходящие действия в реальных ситуациях. Это фундаментально меняет подход к обучению роботов.
Это важный аспект современного ИИ-производства. Прорывы в обучении с подкреплением позволили физическим роботам принимать решения и выполнять сложные физические задачи — от развешивания футболок на вешалки до раскатывания теста для пиццы. Слияние генеративного ИИ и робототехники радикально расширило потенциальные сферы применения в бизнесе, здравоохранении, образовании и индустрии развлечений, предвещая будущее, в котором интеллектуальные машины органично интегрируются в нашу повседневную жизнь.