智能機(jī)器人像新生動(dòng)物一樣,一個(gè)四足機(jī)器人在第一次嘗試行走時(shí)會(huì)絆倒。但是,雖然小馬駒或長(zhǎng)頸鹿需要更長(zhǎng)的時(shí)間才能掌握行走,但機(jī)器人只需一個(gè)小時(shí)就能學(xué)會(huì)流暢地向前移動(dòng)。計(jì)算機(jī)程序充當(dāng)動(dòng)物脊髓的人工演示,并學(xué)習(xí)在短時(shí)間內(nèi)優(yōu)化機(jī)器人的運(yùn)動(dòng)。人工神經(jīng)網(wǎng)絡(luò)在開(kāi)始時(shí)尚未進(jìn)行理想調(diào)整,但可以快速自我調(diào)整。
新生長(zhǎng)頸鹿或小馬駒必須學(xué)會(huì)用腿走路,以盡可能快地避開(kāi)捕食者。動(dòng)物天生具有位于脊髓的肌肉協(xié)調(diào)網(wǎng)絡(luò)。然而,學(xué)習(xí)腿部肌肉和肌腱的精確協(xié)調(diào)需要一些時(shí)間。最初,幼年動(dòng)物嚴(yán)重依賴硬連線脊髓反射。接下來(lái),必須練習(xí)更先進(jìn)和精確的肌肉控制,直到神經(jīng)系統(tǒng)最終很好地適應(yīng)幼年動(dòng)物的腿部肌肉和肌腱。
斯圖加特馬克斯·普朗克智能系統(tǒng)研究所(MPI-IS)的研究人員進(jìn)行了一項(xiàng)研究,以了解動(dòng)物是如何學(xué)會(huì)走路和從絆倒中學(xué)習(xí)的。他們制造了一個(gè)四條腿、狗大小的機(jī)器人,幫助他們了解細(xì)節(jié)。
MPI-IS動(dòng)力運(yùn)動(dòng)研究小組的前博士生菲利克斯·魯佩特(Felix Ruppert)說(shuō):“作為工程師和機(jī)器人專家,我們通過(guò)制造一種具有與動(dòng)物一樣的反射功能并能從錯(cuò)誤中學(xué)習(xí)的機(jī)器人來(lái)尋找答案。但是如果它經(jīng)常絆倒,它會(huì)給我們一個(gè)衡量機(jī)器人行走能力的標(biāo)準(zhǔn)?!?/p>
Felix Ruppert是《在閉環(huán)中央模式生成器中學(xué)習(xí)機(jī)器人動(dòng)力學(xué)的塑料匹配》一書(shū)的第一作者,該書(shū)于2022年7月18日發(fā)表在《自然機(jī)器智能》雜志上。
學(xué)習(xí)算法優(yōu)化虛擬脊髓
在一個(gè)小時(shí)內(nèi)學(xué)會(huì)走路后,魯佩特的機(jī)器人很好地利用了其復(fù)雜的腿部力學(xué)。貝葉斯優(yōu)化算法指導(dǎo)學(xué)習(xí):測(cè)量的腳部傳感器信息與作為程序在機(jī)器人計(jì)算機(jī)中運(yùn)行的模擬虛擬脊髓的目標(biāo)數(shù)據(jù)相匹配。機(jī)器人通過(guò)不斷比較發(fā)送的和預(yù)期的傳感器信息、運(yùn)行反射回路和調(diào)整其電機(jī)控制模式來(lái)學(xué)習(xí)行走。
該學(xué)習(xí)算法適應(yīng)中央模式生成器(CPG)的控制參數(shù)。在人類和動(dòng)物中,這些中央模式發(fā)生器是脊髓中的神經(jīng)元網(wǎng)絡(luò),在沒(méi)有大腦輸入的情況下產(chǎn)生周期性肌肉收縮。中央模式生成器網(wǎng)絡(luò)有助于生成有節(jié)奏的任務(wù),如行走、眨眼或消化。此外,反射是由連接腿部傳感器和脊髓的硬編碼神經(jīng)通路觸發(fā)的非自愿運(yùn)動(dòng)控制動(dòng)作。
只要小動(dòng)物在一個(gè)完全平坦的表面上行走,中央肌電圖就足以控制來(lái)自脊髓的運(yùn)動(dòng)信號(hào)。然而,地面上的一個(gè)小腫塊改變了行走。反射開(kāi)始并調(diào)整動(dòng)作模式,以防止動(dòng)物摔倒。運(yùn)動(dòng)信號(hào)中的這些瞬時(shí)變化是可逆的,或“彈性的”,并且在干擾后,運(yùn)動(dòng)模式恢復(fù)到其原始配置。
但是,如果動(dòng)物在許多運(yùn)動(dòng)周期中沒(méi)有停止跌跌撞撞——盡管有積極的反射——那么必須重新學(xué)習(xí)運(yùn)動(dòng)模式并使其“可塑”,即不可逆。在新生動(dòng)物中,CpG最初調(diào)整得不夠好,動(dòng)物在平坦或不平坦的地形上蹣跚而行。但是,這種動(dòng)物很快學(xué)會(huì)了它的中央處理器和反射如何控制腿部肌肉和肌腱。
拉布拉多大小的名為“莫蒂”的機(jī)器狗也是如此。更重要的是,機(jī)器人在大約一個(gè)小時(shí)內(nèi)比動(dòng)物更快地優(yōu)化其運(yùn)動(dòng)模式。莫蒂的中央處理器是在一個(gè)小而輕的計(jì)算機(jī)上模擬的,該計(jì)算機(jī)控制著機(jī)器人腿的運(yùn)動(dòng)。這個(gè)虛擬脊髓被放置在四足機(jī)器人的背部,頭部所在的位置。在機(jī)器人順利行走所需的一小時(shí)內(nèi),來(lái)自機(jī)器人腳的傳感器數(shù)據(jù)會(huì)不斷與機(jī)器人的中央處理器預(yù)測(cè)的預(yù)期著陸進(jìn)行比較。如果機(jī)器人絆倒,學(xué)習(xí)算法會(huì)改變腿來(lái)回?cái)[動(dòng)的距離、擺動(dòng)的速度以及腿在地面上的長(zhǎng)度。調(diào)整后的運(yùn)動(dòng)也會(huì)影響機(jī)器人如何更好地利用其柔順的腿部力學(xué)。在學(xué)習(xí)過(guò)程中,中央處理器發(fā)送適應(yīng)的電機(jī)信號(hào),使機(jī)器人從此減少絆倒并優(yōu)化其行走。在這個(gè)框架中,虛擬脊髓沒(méi)有關(guān)于機(jī)器人腿部設(shè)計(jì)、電機(jī)和彈簧的明確知識(shí)。由于對(duì)機(jī)器的物理一無(wú)所知,它缺少一個(gè)機(jī)器人“模型”。
Ruppert解釋說(shuō):“我們的機(jī)器人實(shí)際上是‘天生’的,對(duì)腿的解剖結(jié)構(gòu)或工作方式一無(wú)所知。CPG類似于自然界提供的內(nèi)置自動(dòng)行走智能,我們已經(jīng)將其傳輸?shù)綑C(jī)器人。計(jì)算機(jī)產(chǎn)生控制腿部電機(jī)的信號(hào),機(jī)器人最初行走和絆倒。數(shù)據(jù)從傳感器返回虛擬脊髓,在那里比較傳感器和CPG數(shù)據(jù)。如果傳感器數(shù)據(jù)與預(yù)期數(shù)據(jù)不匹配,學(xué)習(xí)alg算法改變行走行為,直到機(jī)器人行走良好,沒(méi)有絆倒。在保持反射活躍和監(jiān)測(cè)機(jī)器人步履蹣跚的同時(shí),更改中央處理器輸出是學(xué)習(xí)過(guò)程的核心部分。”
節(jié)能機(jī)器人狗控制
莫蒂的電腦在行走過(guò)程中只消耗5瓦的電力。知名制造商生產(chǎn)的工業(yè)四足機(jī)器人已經(jīng)學(xué)會(huì)了在復(fù)雜控制器的幫助下運(yùn)行,因此耗電量要大得多。他們的控制器用機(jī)器人的精確質(zhì)量和身體幾何形狀的知識(shí)編碼——使用機(jī)器人模型。它們通常需要幾十瓦,甚至幾百瓦的功率。這兩種機(jī)器人都能動(dòng)態(tài)高效地運(yùn)行,但在斯圖加特模型中,計(jì)算能耗要低得多。它還提供了對(duì)動(dòng)物解剖學(xué)的重要見(jiàn)解。
亞歷山大·巴德里·斯普羅維茨(AlexanderBadri Spr witz)說(shuō):“我們不容易研究活動(dòng)物的脊髓。但我們可以在機(jī)器人中模擬一個(gè)?!彼c魯佩特(Ruppert)共同撰寫(xiě)了這本出版物,并領(lǐng)導(dǎo)著動(dòng)態(tài)運(yùn)動(dòng)研究小組?!拔覀冎涝S多動(dòng)物中都存在這些CpG。我們知道反射是嵌入的;但我們?nèi)绾螌烧呓Y(jié)合起來(lái),使動(dòng)物通過(guò)反射和CpG學(xué)習(xí)動(dòng)作?這是機(jī)器人學(xué)和生物學(xué)交叉點(diǎn)的基礎(chǔ)研究。機(jī)器人模型為我們回答了生物學(xué)本身無(wú)法回答的問(wèn)題。”
以上就是小編的分享,希望可以幫助到大家。