科技媒體 notebookcheck (8 月 27 日)發(fā)布博文,報(bào)道稱波士頓動(dòng)力公司宣布,其四足機(jī)器人犬 Spot 通過(guò)強(qiáng)化學(xué)習(xí)掌握了多次后空翻。
官方表示這一動(dòng)作并非客戶的直接需求,但這背后的強(qiáng)化學(xué)習(xí)訓(xùn)練能顯著提升 Spot 在極端情況下的生存能力,例如在跌倒、滑倒或絆倒時(shí)更好地調(diào)整姿態(tài),從而保護(hù)機(jī)身及背部昂貴的傳感器免受損壞。
在研發(fā)過(guò)程中,波士頓動(dòng)力首先在計(jì)算機(jī)中模擬后空翻動(dòng)作。然而,正如公司機(jī)器人工程師阿倫?庫(kù)馬爾在視頻中介紹的那樣,初期將訓(xùn)練成果應(yīng)用到真實(shí)機(jī)器人上幾乎每次都會(huì)失敗。
為了減少損壞風(fēng)險(xiǎn),團(tuán)隊(duì)最初在體操墊上進(jìn)行測(cè)試,隨后逐漸增加挑戰(zhàn)難度,直至讓 Spot 在更高風(fēng)險(xiǎn)的環(huán)境中完成動(dòng)作。
波士頓動(dòng)力表示,Spot 解鎖連續(xù)后空翻這個(gè)高難度技能后,還帶來(lái)了意外收獲 —— 其行走姿態(tài)變得更加自然,接近真實(shí)四足動(dòng)物的動(dòng)作模式。
強(qiáng)化學(xué)習(xí)是此次訓(xùn)練的核心方法。通過(guò)大量試錯(cuò)與反饋調(diào)整,Spot 逐漸掌握了精確的身體控制能力,甚至能在前腿安裝滾輪的情況下保持平衡。