Den första veckan i juli 2025 har bevittnat ett betydande genombrott inom artificiell intelligens och robotik, då forskare demonstrerat maskiner med enastående förmåga att förutse rörelser och anpassa strategier i dynamiska miljöer.
I centrum för denna utveckling står ANYmal-D, en fyrbent robot utvecklad av ETH Zürich som självständigt kan spela badminton mot mänskliga motståndare. Roboten använder ett innovativt styrsystem baserat på förstärkningsinlärning, vilket gör det möjligt att följa, förutsäga och skickligt returnera fjäderbollar. Dess sofistikerade "hjärna" gör det möjligt att följa fjäderbollens bana, förutse dess väg och snabbt röra sig över banan för att fånga upp och returnera den. Denna prestation, som beskrivs i tidskriften Science Robotics, visar potentialen för att använda benförsedda robotar i dynamiska uppgifter som kräver exakt perception och snabba, helkroppsliga reaktioner.
Roboten är utrustad med en stereokamera för synbaserad perception och en dynamisk arm för att hantera ett badmintonracket, vilket kräver exakt synkronisering av perception, rörelse och armrörelser. Forskarna tränade systemet med förstärkningsinlärning, vilket gjorde det möjligt för roboten att utveckla effektiva strategier genom experiment och interaktion med sin omgivning. I tester mot mänskliga spelare visade ANYmal-D sin förmåga att effektivt navigera på banan, returnera slag i varierande hastigheter och vinklar samt upprätthålla dueller på upp till 10 slag i rad.
Detta genombrott är mer än bara en teknologisk kuriositet. Den fyrbenta roboten använder syn, sensordata och maskininlärning för att förutse rörelser och anpassa sin strategi, och visar på framtiden för samarbete mellan människa och robot inom sport och träning. Projektet kombinerar fysisk robotik med avancerat AI-resonemang, och öppnar nya möjligheter för maskiner att arbeta tillsammans med människor i komplexa, oförutsägbara miljöer.
Robotforskare har gjort stora genombrott i hur robotar lär sig och anpassar sig. En viktig framgång handlar om att kombinera olika typer av data för att göra den användbar för robotar. Till exempel kan forskare samla in data från människor som utför uppgifter med sensorer, kombinera det med teleoperationsdata från människor som styr robotarmar, och komplettera detta med internetbilder och videor av människor som utför liknande handlingar. Genom att slå samman dessa datakällor i nya AI-modeller får robotar ett enormt försprång jämfört med de som tränats med traditionella metoder. Att se flera sätt att utföra en uppgift gör det lättare för AI-modeller att improvisera och avgöra lämpliga nästa steg i verkliga situationer. Detta innebär en grundläggande förändring i hur robotar lär sig.
Detta är en viktig aspekt av AI-tillverkning idag. Genombrott inom förstärkningsinlärning har gjort det möjligt för fysiska robotar att fatta beslut och utföra intrikata fysiska uppgifter, från att hänga t-shirts på galgar till att knåda pizzadeg. Denna sammansmältning av generativ AI och robotik har radikalt utökat potentiella tillämpningar inom näringsliv, sjukvård, utbildning och underhållning, och antyder en framtid där intelligenta maskiner sömlöst integreras i våra dagliga liv.