在茫茫人海中鎖定一個(gè)人,無(wú)論他/她身形有多快,都能緊緊盯???世界上最先進(jìn)的仿生眼可以做到。

能跟隨目標(biāo)靈活轉(zhuǎn)動(dòng)的仿生眼

張曉林在介紹全球唯一的全自動(dòng)3D攝像系統(tǒng)

能跟隨目標(biāo)靈活轉(zhuǎn)動(dòng)的仿生眼
日前,在中科院微系統(tǒng)與信息技術(shù)研究所,記者看到了由國(guó)家“千人計(jì)劃”學(xué)者張曉林團(tuán)隊(duì)研發(fā)的這套迄今最接近人眼的視覺(jué)系統(tǒng)。作為上海“腦-智工程”的重要部分,該團(tuán)隊(duì)目前已成立了兩家公司,并獲得了數(shù)千萬(wàn)元投資。
像人眼一樣“明眸善睞”
走進(jìn)實(shí)驗(yàn)室,記者看到一個(gè)黑色三腳架上架設(shè)著一臺(tái)設(shè)備,設(shè)備上兩個(gè)可以靈活轉(zhuǎn)動(dòng)的攝像頭,像極了一對(duì)人的眼珠。旁邊連接設(shè)備的大屏幕上呈現(xiàn)出它實(shí)時(shí)拍下的立體圖像。一旦攝像頭盯住一個(gè)目標(biāo),只要目標(biāo)移動(dòng),攝像頭就會(huì)跟著轉(zhuǎn)動(dòng),攝像機(jī)的“視線(xiàn)”就像被牢牢吸住了一般。
“人的單個(gè)眼球活動(dòng)有旋轉(zhuǎn)、水平、俯仰三個(gè)自由度,一雙眼睛就有6個(gè)自由度。”張曉林解釋?zhuān)麄冇?臺(tái)電機(jī)來(lái)模擬眼部肌肉,讓攝像頭能像人眼一樣“明眸善睞”。這對(duì)仿生眼視場(chǎng)寬度可以達(dá)到150°,今后科研人員還考慮讓它架上“脖子”,像人一樣可以左顧右盼,“即使一個(gè)目標(biāo)可以每秒繞兩圈的速度移動(dòng),它也可以牢牢盯住。”
“目前,大多數(shù)人工智能視覺(jué)只能做到平行視覺(jué),如果當(dāng)機(jī)器發(fā)生跳躍、遇到障礙物,那就無(wú)法成像了。”張曉林說(shuō),這是因?yàn)楝F(xiàn)在科學(xué)家對(duì)大腦中視覺(jué)識(shí)別、分析、決策方面已有較多了解,反而對(duì)小腦中控制眼球運(yùn)動(dòng)、上丘腦中控制跳躍性視覺(jué)、腦干中融合視聽(tīng)觸覺(jué)的機(jī)制不甚了解,“我們則希望在這方面有所突破,讓仿生視覺(jué)真正走向類(lèi)腦智能。”
接近人眼之后,他們還將嘗試超越人眼。比如,張曉林團(tuán)隊(duì)已在開(kāi)展“鷹眼”研究。“鷹的眼球有兩個(gè)中心凹,深的一個(gè)可以單獨(dú)工作,從上千米的距離外看清目標(biāo),而淺的那個(gè)則需雙眼配合,在近距離產(chǎn)生縱深感,幫助老鷹更好地抓取獵物。”他說(shuō),這只是嘗試之一,“變色龍眼球可以分別轉(zhuǎn)動(dòng),或許可以讓仿生眼具有更多功能。”

張曉林在介紹全球唯一的全自動(dòng)3D攝像系統(tǒng)
在上海找到志同道合者
雖然在全自動(dòng)3D仿生視覺(jué)系統(tǒng)領(lǐng)域做得風(fēng)生水起,但張曉林已有3年不曾以第一作者的身份,在專(zhuān)業(yè)雜志上發(fā)表論文。“對(duì)于一個(gè)很多人還不相信的東西,做出來(lái)才是最有說(shuō)服力的。”他因此將更多精力放在研制和專(zhuān)利保護(hù)上。
先在日本橫濱國(guó)立大學(xué)學(xué)了8年工程,又在東京醫(yī)科齒科大學(xué)從事了8年醫(yī)學(xué)相關(guān)工作,從2003年起,張曉林到東京工業(yè)大學(xué)開(kāi)始仿生眼研究。2013年,他帶領(lǐng)團(tuán)隊(duì)的6名博士一起回國(guó),來(lái)到微系統(tǒng)所,開(kāi)始人工智能仿生視覺(jué)的研究。
“這是一個(gè)跨好幾個(gè)學(xué)科的新領(lǐng)域,涉及醫(yī)學(xué)、腦科學(xué)、控制、圖像處理等等。”他說(shuō)。
回國(guó)后,由于領(lǐng)域太新,沒(méi)有什么同行,張曉林在申請(qǐng)項(xiàng)目和經(jīng)費(fèi)時(shí),也遇到過(guò)不少尷尬,“即使發(fā)了論文,也很少有人引用,怎么也得不到高影響因子。”但他覺(jué)得,對(duì)一個(gè)真正創(chuàng)新的領(lǐng)域,剛開(kāi)始總是少人關(guān)注,即使發(fā)了文章,影響力也要過(guò)很多年才能看出,所以先做實(shí)在事更緊要。
在上海的科創(chuàng)大環(huán)境中,他找到了不少志同道合者——上海“腦-智工程”項(xiàng)目打通了從基礎(chǔ)腦科學(xué)研究到類(lèi)腦智能技術(shù)的聯(lián)系,這正是他所盼望的。在這個(gè)項(xiàng)目中,他負(fù)責(zé)視覺(jué)系統(tǒng),科大訊飛負(fù)責(zé)語(yǔ)音,寒武紀(jì)負(fù)責(zé)神經(jīng)網(wǎng)絡(luò)芯片……他說(shuō),深度學(xué)習(xí)可以讓人工智能視覺(jué)系統(tǒng)得到快速發(fā)展,在這里發(fā)展自己的事業(yè),的確找對(duì)了地方。
為未來(lái)市場(chǎng)而努力
采訪(fǎng)間隙,張曉林接了一個(gè)很長(zhǎng)的電話(huà),與人探討一個(gè)專(zhuān)利的價(jià)格問(wèn)題。對(duì)于高級(jí)的智能視覺(jué)系統(tǒng),市場(chǎng)需求還只是初露端倪。
最近,CBA(中國(guó)男子籃球職業(yè)聯(lián)賽)公司找到張曉林,希望能將他的新技術(shù)用在監(jiān)控籃球比賽上。“有時(shí)一個(gè)球到底是否出界,現(xiàn)在的攝像系統(tǒng)無(wú)法快速變焦盯住籃球。”他說(shuō),用他的技術(shù)則可以做到。
3D電影拍攝成本高,主要因?yàn)橐獣r(shí)刻保持兩臺(tái)攝像機(jī)的光軸落在同一平面上,才能形成立體視覺(jué)。“我們的設(shè)備可以自動(dòng)調(diào)節(jié),拍攝的時(shí)間成本就下降到普通攝像機(jī)的水平。”張曉林說(shuō),他們已為上海戲曲工程提供了拍攝設(shè)備。
今后,這塊需求還會(huì)更多。比如,現(xiàn)在雙臂機(jī)器人已經(jīng)誕生,今后所從事的不再是流水線(xiàn)上的單一工作,而是需要揀選零件,進(jìn)行不同的裝配,那么仿生立體視覺(jué)就很重要。又如無(wú)人汽車(chē)上的視覺(jué)系統(tǒng),也要能夠?qū)?fù)雜的路況進(jìn)行判斷,尤其是遇到顛簸等情況。
不過(guò)張曉林也感嘆:“人才太難找了!”今年他把培養(yǎng)出的學(xué)生大部分留在了自己公司,開(kāi)出了比市場(chǎng)平均水平更高的年薪。他希望,有更多人可以加入到這個(gè)領(lǐng)域中,盡管對(duì)學(xué)科交叉背景的要求很高,但為未來(lái)市場(chǎng)而努力,很值得。