麻省理工學院的研究人員發(fā)明了一種方法,可以有效地優(yōu)化用于目標任務的軟機器人的控制和設計,這在傳統(tǒng)上是一項艱巨的任務。
軟機器人具有彈性,柔性,可拉伸的主體,這些主體在任何給定時刻基本上可以移動無數(shù)種方式。從計算上講,這代表了一個高度復雜的“狀態(tài)表示”,它描述了機器人各部分的運動方式。軟機器人的狀態(tài)表示可能具有數(shù)百萬個維度,這使得很難計算出使機器人完成復雜任務的最佳方式。
在下個月的神經信息處理系統(tǒng)會議上,麻省理工學院的研究人員將提出一個模型,該模型根據(jù)機器人及其環(huán)境的基本物理特性,學習緊湊的或“低維”的詳細狀態(tài)表示形式。 。這有助于模型迭代地優(yōu)化滿足特定任務的運動控制和材料設計參數(shù)。
“軟機器人是無限維的生物,它們在任何給定時刻都會以十億種不同的方式彎曲,”第一作者安德魯·斯皮爾伯格(Andrew Spielberg)說,他是計算機科學和人工智能實驗室(CSAIL)的研究生。“但是,實際上,軟物體可能會以自然方式彎曲。我們發(fā)現(xiàn)可以在低維描述中非常緊湊地描述軟機器人的自然狀態(tài)。我們通過學習良好的描述來優(yōu)化軟機器人的控制和設計可能的狀態(tài)。”
在仿真中,該模型使2D和3D軟機器人能夠比當前最新技術更快,更準確地完成任務,例如移動一定距離或到達目標位置。研究人員接下來計劃在真正的軟機器人中實施該模型。
CSAIL的研究生Allan Zhao,Tao Du和Huyuanming則是與Spielberg一同加入本文的人。CSAIL總監(jiān)Daniela Rus以及電機工程和計算機科學系的Andrew and Erna Viterbi教授;麻省理工學院電氣工程和計算機科學副教授,計算制造小組負責人Wojciech Matusik。
“在環(huán)學習”
軟機器人技術是一個相對較新的研究領域,但它對高級機器人技術有希望。例如,柔性車身可以提供與人類更安全的交互,更好的對象操縱和更大的可操縱性,以及其他好處。
在仿真中對機器人的控制依賴于“觀察者”,該程序計算變量以查看軟機器人如何移動以完成任務。在先前的工作中,研究人員將軟機器人分解為手工設計的模擬粒子簇。粒子包含重要信息,有助于縮小機器人的可能運動范圍。例如,如果機器人試圖以某種方式彎曲,則執(zhí)行器可能會對該移動進行足夠的抵抗,以至于可以忽略不計。但是,對于這種復雜的機器人,在仿真過程中手動選擇要跟蹤的集群可能很棘手。
在這項工作的基礎上,研究人員設計了一種“循環(huán)中學習優(yōu)化”方法,其中所有優(yōu)化參數(shù)都是在許多模擬的單個反饋循環(huán)中學習的。并且,在學習優(yōu)化的同時(或“在循環(huán)中”)該方法還學習狀態(tài)表示。
該模型采用一種稱為“材料點方法”(MPM)的技術,該技術可模擬被背景網格包圍的連續(xù)材料(例如泡沫和液體)顆粒的行為。這樣,它無需任何額外的計算就可以將機器人的粒子及其可觀察的環(huán)境捕獲為像素或3D像素(稱為體素)。
在學習階段,此原始粒子網格信息被饋送到機器學習組件,該組件學習輸入圖像,將其壓縮為低維表示,然后將表示解壓縮回輸入圖像。如果此“自動編碼器”在壓縮輸入圖像時保留了足夠的細節(jié),則可以從壓縮中準確地重新創(chuàng)建輸入圖像。
在研究人員的工作中,自動編碼器學習到的壓縮表示形式用作機器人的低維狀態(tài)表示形式。在優(yōu)化階段,該壓縮表示形式將返回到控制器,該控制器將為機器人的每個粒子在下一個MPM模擬步驟中應如何運動輸出計算出的驅動力。
同時,控制器使用該信息來調整每個粒子的最佳剛度,以實現(xiàn)其所需的運動。將來,該材料信息可能會用于3D打印軟機器人,在該3D打印軟機器人中,每個粒子點的打印硬度可能會略有不同。斯皮爾伯格說:“這允許根據(jù)機器人的動作創(chuàng)建與特定任務相關的機器人設計。”“通過一起學習這些參數(shù),您可以使所有內容盡可能地保持同步,從而使設計過程更加容易。”
優(yōu)化更快
依次將所有優(yōu)化信息反饋到循環(huán)的起點,以訓練自動編碼器。在許多模擬中,控制器學習最佳運動和材料設計,而自動編碼器學習越來越詳細的狀態(tài)表示。斯皮爾伯格說:“關鍵是我們希望低維狀態(tài)具有很好的描述性。”
機器人在設定的時間段內達到其模擬的最終狀態(tài)(例如,盡可能接近目標位置)后,將更新“損失函數(shù)”。這是機器學習的關鍵組成部分,它試圖最大程度地減少一些錯誤。在這種情況下,它可以使機器人距目標的距離最小化。該損失函數(shù)流回到控制器,該控制器使用誤差信號調整所有優(yōu)化的參數(shù),以最好地完成任務。
斯皮爾伯格說,如果研究人員試圖將模擬的所有原始粒子直接送入控制器,而沒有壓縮步驟,則“運行和優(yōu)化時間將會激增”。使用壓縮表示,研究人員能夠將每次優(yōu)化迭代的運行時間從幾分鐘減少到大約10秒。
研究人員通過對各種2D和3D兩足動物和四足機器人的仿真驗證了他們的模型。他們的研究人員還發(fā)現(xiàn),雖然使用傳統(tǒng)方法的機器人最多可以進行30,000個仿真來優(yōu)化這些參數(shù),但是在模型上訓練的機器人僅進行了約400個仿真。
將模型部署到實際的軟機器人中意味著解決現(xiàn)實噪聲和不確定性問題,這可能會降低模型的效率和準確性。但是,將來,研究人員希望為軟機器人設計從仿真到制造的完整流水線。