Перший тиждень липня 2025 року ознаменувався значним проривом у сфері штучного інтелекту та робототехніки: дослідники продемонстрували машини з безпрецедентною здатністю передбачати рухи та змінювати стратегії у динамічних середовищах.
У центрі цієї інновації — ANYmal-D, чотириногий робот, розроблений ETH Zurich, який автономно грає у бадмінтон з людськими суперниками. Робот використовує інноваційну систему керування на основі навчання з підкріпленням, що дозволяє йому відстежувати, прогнозувати та майстерно повертати волани. Його складний «мозок» дає змогу слідкувати за траєкторією волана, передбачати його політ і швидко пересуватися майданчиком для перехоплення та повернення удару. Це досягнення, детально описане в журналі Science Robotics, демонструє потенціал застосування роботів на ногах у динамічних завданнях, які вимагають точної перцепції та швидких, повнотілесних реакцій.
Робот оснащений стереокамерою для зорового сприйняття та динамічною рукою для тримання ракетки, що вимагає точної синхронізації зору, руху та маніпуляцій рукою. Дослідники навчали систему за допомогою навчання з підкріпленням, що дало змогу роботу виробити ефективні стратегії шляхом експериментів та взаємодії з оточенням. У тестах проти людей ANYmal-D продемонстрував здатність ефективно пересуватися майданчиком, повертати удари різної швидкості та під різними кутами, а також підтримувати розіграші до 10 ударів поспіль.
Цей прорив — більше, ніж просто технологічна цікавинка. Чотириногий робот використовує зір, сенсорні дані та машинне навчання для передбачення рухів і коригування стратегії, демонструючи майбутнє співпраці людини й робота у спорті та тренуваннях. Проєкт поєднує фізичну робототехніку з передовим AI-мисленням, відкриваючи нові можливості для машин, здатних працювати поруч із людьми у складних, непередбачуваних середовищах.
Робототехніки досягли великих проривів у тому, як роботи навчаються та адаптуються. Одним із ключових досягнень стало поєднання різних типів даних для їх використання роботами. Наприклад, дослідники можуть збирати дані з людей, які виконують завдання із сенсорами, поєднувати їх із даними телеоперації, коли люди керують роботизованими руками, та доповнювати це інтернет-відео й зображеннями людей, які виконують схожі дії. Об’єднуючи ці джерела у нові AI-моделі, роботи отримують величезну перевагу над тими, що навчаються традиційними методами. Бачачи різні способи виконання одного завдання, AI-моделі легше імпровізувати та визначати наступні кроки у реальних ситуаціях. Це означає фундаментальну зміну у способах навчання роботів.
Це важливий аспект сучасного виробництва на базі ШІ. Прориви у навчанні з підкріпленням дозволили фізичним роботам приймати рішення та виконувати складні фізичні завдання — від розвішування футболок на вішалки до приготування тіста для піци. Поєднання генеративного ШІ та роботів радикально розширило потенційні сфери застосування у бізнесі, охороні здоров’я, освіті та розвагах, формуючи майбутнє, де інтелектуальні машини органічно інтегруються у наше повсякденне життя.