一種新方法可以讓腿式機(jī)器人更快地學(xué)會(huì)“自主”移動(dòng)
近年來,機(jī)器人學(xué)家已經(jīng)開發(fā)出具有廣泛解剖結(jié)構(gòu)和功能的移動(dòng)機(jī)器人。有腿機(jī)器人是一類在非結(jié)構(gòu)化和動(dòng)態(tài)環(huán)境中特別有前途的機(jī)器人系統(tǒng)(即,有兩條腿或兩條腿以上的機(jī)器人,通常與動(dòng)物相似)。
雖然腿式機(jī)器人是非常有前途的系統(tǒng),但可靠地控制它們的運(yùn)動(dòng)或移動(dòng)可能是一項(xiàng)挑戰(zhàn)。雖然一些團(tuán)隊(duì)之前已經(jīng)手動(dòng)創(chuàng)建了運(yùn)動(dòng)控制器,但其他團(tuán)隊(duì)則嘗試使用機(jī)器學(xué)習(xí)算法對其進(jìn)行自動(dòng)編程。自動(dòng)設(shè)計(jì)它們可能是有利的,但它通常需要長期訓(xùn)練機(jī)器學(xué)習(xí)算法。
Mathias Thor和Poramate Manoonpong,丹麥南部大學(xué)M.RSK MC KNNY M勒勒研究所的兩名研究人員最近開發(fā)了一種訓(xùn)練腿機(jī)器人的控制器的替代方法。這種方法發(fā)表在《自然機(jī)器智能》上的一篇論文中,可用于在短時(shí)間內(nèi)獲得不同復(fù)雜度的運(yùn)動(dòng)行為。
“我們的論文是基于我之前的工作,我使用中央模式發(fā)生器(CPG)來控制腿部機(jī)器人的運(yùn)動(dòng),這項(xiàng)新研究的主要目的是證明運(yùn)動(dòng)控制器可以簡單易懂,但能夠產(chǎn)生復(fù)雜的運(yùn)動(dòng)行為。”開展這項(xiàng)研究的研究人員之一Mathias Thor解釋道。
Thor和Manoonpong開發(fā)的新型靈活控制器基于仿生人工中央模式發(fā)生器(CPG)和前置運(yùn)動(dòng)神經(jīng)網(wǎng)絡(luò)。GPG是一種生物神經(jīng)回路,允許動(dòng)物天生有節(jié)奏地運(yùn)動(dòng),從而產(chǎn)生呼吸、行走、飛行和游泳等行為。許多計(jì)算機(jī)科學(xué)家最近一直試圖在機(jī)器中復(fù)制這些生物系統(tǒng),以實(shí)現(xiàn)不同類型的機(jī)器人運(yùn)動(dòng)。
CPG產(chǎn)生有節(jié)奏的信號,讓馬達(dá)跟隨,而前置馬達(dá)神經(jīng)網(wǎng)絡(luò)重塑CPG輸出,以獲得高性能,重塑基于機(jī)器人形態(tài)和感官反饋。我們的控制方法的主要優(yōu)點(diǎn)是學(xué)習(xí)速度快,易于理解和模塊化。
作為研究的一部分,研究人員在一個(gè)名為MORF的六條腿實(shí)體機(jī)器人上評估了他們的方法。在測試中,他們發(fā)現(xiàn)它取得了顯著的效果,在很短的訓(xùn)練時(shí)間后產(chǎn)生了他們想要的運(yùn)動(dòng)行為。
新方法還具有高度靈活性和適應(yīng)性,因?yàn)樗试S開發(fā)人員輕松添加新的行為特定模塊,從而產(chǎn)生越來越復(fù)雜的移動(dòng)行為。未來,全世界的機(jī)器人學(xué)家和計(jì)算機(jī)科學(xué)家可以使用它來快速訓(xùn)練各種腿部機(jī)器人,以新的有效方式導(dǎo)航周圍環(huán)境。
托爾補(bǔ)充道,使用我們的方法時(shí),運(yùn)動(dòng)控制器不需要復(fù)雜,也不需要訓(xùn)練很多小時(shí)或幾天,相反,復(fù)雜的運(yùn)動(dòng)可以從許多簡單的并行模塊中產(chǎn)生。由于控制器可以在不到30分鐘的時(shí)間內(nèi)學(xué)習(xí)新的行為,我們希望直接在真實(shí)世界的腿機(jī)器人上學(xué)習(xí)運(yùn)動(dòng)行為,而不是在模擬的機(jī)器人上。