養(yǎng)過寵物的人都知道,動物是非常敏捷的。他們能夠做的一些事情非常令人印象深刻。伯克利伯克利人工智能研究 (BAIR) 實驗室的一組研究人員正試圖教機器人像動物一樣移動??茖W家們表示,他們已經(jīng)提出了一個通過模仿動物來學習機器人運動技能的框架。
該框架使用記錄的動物參考運動剪輯,使用強化學習來訓練控制策略,使機器人能夠模仿現(xiàn)實世界中的運動。通過為系統(tǒng)提供不同的參考動作,該團隊可以訓練四足機器人執(zhí)行各種敏捷行為。
機器人學習的行為范圍從快速步行門到動態(tài)跳躍和轉彎。機器人的策略最初在模擬環(huán)境中進行訓練,然后使用潛在空間適應技術將訓練轉移到現(xiàn)實世界。該技術可以使用來自真實機器人的有限數(shù)據(jù)量有效地調(diào)整策略。
科學家表示,該框架具有三個主要組成部分,包括運動重定向、運動模仿和領域適應。使用給定參考運動的第一步是創(chuàng)建運動重新定位階段圖,將運動從原始動物的形態(tài)重新定位到機器人形態(tài)。下一步是運動模仿階段,并使用重新定位的參考運動來訓練在模擬環(huán)境中模仿運動的策略。最后一步是域適應階段,通過樣本有效的域適應過程將策略從模擬轉移到真實機器人。
該團隊指出,模擬器通常只提供對現(xiàn)實世界的粗略近似。因此,在模擬中訓練的策略在現(xiàn)實世界中通常表現(xiàn)不佳。轉移策略將模擬交易到現(xiàn)實世界,該團隊使用樣本高效的域適應技術使策略適應現(xiàn)實世界,只需在真實機器人上進行少量試驗。該技術能夠適應最初表現(xiàn)不佳的場景,該場景導致機器人跌倒到機器人穩(wěn)定的場景中。結果是一個更快、更流暢的移動機器人。