上周末的必讀內(nèi)參智東西開始給大家介紹機(jī)器人了,今天內(nèi)容繼續(xù)跟進(jìn)。人們都說活到老,學(xué)到老。其實(shí)機(jī)器人學(xué)習(xí)能力也是很強(qiáng)的。想必你一定聽說過一種機(jī)器學(xué)習(xí)的新研究領(lǐng)域就叫“深度學(xué)習(xí)”。好了,不能再劇透了,有點(diǎn)跑偏了,我們還是直接來說事兒吧。

事情是這樣?jì)饍旱摹<又荽髮W(xué)伯克利分校副教授Pieter abbeel的實(shí)驗(yàn)室研制了一個名叫達(dá)爾文的小機(jī)器人,這“孩子”最近正在學(xué)走路,就像許多孩子一樣,小達(dá)爾文走的也是搖搖擺擺的。但是每一次笨拙的動作都是機(jī)器人處理不熟悉或具有挑戰(zhàn)性的環(huán)境的新嘗試。機(jī)器人通過使用有點(diǎn)類似于兒童學(xué)習(xí)時的神經(jīng)過程來學(xué)會執(zhí)行新任務(wù)。直到前一陣兒,達(dá)爾文“小盆友”還得綁著跟繩子才能伸伸胳膊伸伸腿,勉強(qiáng)站起來不跌倒??雌饋砭褪窍旅孢@樣的。

好了,嚴(yán)肅點(diǎn)。這一小只機(jī)器人學(xué)走路使用了新的方法。這孩子是在控制幾種神經(jīng)網(wǎng)絡(luò)來移動身體的。具體而言是這樣的。達(dá)爾文的運(yùn)動是由幾個模擬神經(jīng)網(wǎng)絡(luò)算法模仿學(xué)習(xí),通過以時間為變量加強(qiáng)或削弱發(fā)生在生物大腦之間的連接神經(jīng)元的方式來應(yīng)對外界信息的輸入。這種極為復(fù)雜的神經(jīng)網(wǎng)絡(luò)算法,被稱為深度學(xué)習(xí)網(wǎng)絡(luò),其中有很多層的模擬神經(jīng)元。
舉個例子,如果機(jī)器人想要學(xué)會站立或扭曲身體,它首先會執(zhí)行一系列模擬,這是為了訓(xùn)練高層深度學(xué)習(xí)網(wǎng)絡(luò)如何執(zhí)行任務(wù)。研究者這時候就賦予了機(jī)器人一個“想象中的過程”,這就為機(jī)器人提供總體指導(dǎo)。而第二個深度學(xué)習(xí)網(wǎng)絡(luò)是訓(xùn)練應(yīng)對執(zhí)行任務(wù)時對機(jī)器人的關(guān)節(jié)的動力學(xué)和真實(shí)環(huán)境的復(fù)雜性。
研究人員讓機(jī)器人學(xué)會站立,當(dāng)腳下的地面傾斜時也要保持正直。加州大學(xué)伯克利分校的博士后研究員Igor Mordatch說:“這個模擬實(shí)驗(yàn)大約持續(xù)一個小時。在這期間,達(dá)爾文要學(xué)習(xí)如何才能腳下不滑”。
Abbeel小組此前表明深度學(xué)習(xí)可以使一個機(jī)器人執(zhí)行各類任務(wù)。Abbeel本人說:“我們試圖能夠處理更多的變化,現(xiàn)在只要一點(diǎn)點(diǎn)超出設(shè)計(jì)的變化對它來說都是很難的。”
這項(xiàng)新技術(shù)被證明可以用于任何機(jī)器人在各種真實(shí)的工作環(huán)境,但是目前,如何能讓機(jī)器人走得更加自然優(yōu)美恐怕是件極為有用的技術(shù)突破。他們現(xiàn)有的方法時設(shè)計(jì)一個算法,考慮其中的動力學(xué)過程,比如走路或跑步等等。
華盛頓大學(xué)計(jì)算機(jī)科學(xué)與工程系專門從事機(jī)器人感知和控制的迪特爾???怂菇淌谡J(rèn)為神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)在機(jī)器人領(lǐng)域有巨大的發(fā)展?jié)摿ΑKf:“我對這整個研究方向非常感興趣,如果你想在現(xiàn)實(shí)世界行動,問題總是會出現(xiàn),因?yàn)槟P筒豢赡苁峭昝赖?。機(jī)器學(xué)習(xí),尤其是深度學(xué)習(xí)最有價(jià)值的地方就在于這個方法能讓系統(tǒng)與實(shí)際環(huán)境做好交互”。