在茫茫人海中鎖定一個人,無論他/她身形有多快,都能緊緊盯?。渴澜缟献钕冗M的仿生眼可以做到。

能跟隨目標靈活轉(zhuǎn)動的仿生眼

張曉林在介紹全球唯一的全自動3D攝像系統(tǒng)

能跟隨目標靈活轉(zhuǎn)動的仿生眼
日前,在中科院微系統(tǒng)與信息技術(shù)研究所,記者看到了由國家“千人計劃”學(xué)者張曉林團隊研發(fā)的這套迄今最接近人眼的視覺系統(tǒng)。作為上海“腦-智工程”的重要部分,該團隊目前已成立了兩家公司,并獲得了數(shù)千萬元投資。
像人眼一樣“明眸善睞”
走進實驗室,記者看到一個黑色三腳架上架設(shè)著一臺設(shè)備,設(shè)備上兩個可以靈活轉(zhuǎn)動的攝像頭,像極了一對人的眼珠。旁邊連接設(shè)備的大屏幕上呈現(xiàn)出它實時拍下的立體圖像。一旦攝像頭盯住一個目標,只要目標移動,攝像頭就會跟著轉(zhuǎn)動,攝像機的“視線”就像被牢牢吸住了一般。
“人的單個眼球活動有旋轉(zhuǎn)、水平、俯仰三個自由度,一雙眼睛就有6個自由度。”張曉林解釋,他們用6臺電機來模擬眼部肌肉,讓攝像頭能像人眼一樣“明眸善睞”。這對仿生眼視場寬度可以達到150°,今后科研人員還考慮讓它架上“脖子”,像人一樣可以左顧右盼,“即使一個目標可以每秒繞兩圈的速度移動,它也可以牢牢盯住。”
“目前,大多數(shù)人工智能視覺只能做到平行視覺,如果當機器發(fā)生跳躍、遇到障礙物,那就無法成像了。”張曉林說,這是因為現(xiàn)在科學(xué)家對大腦中視覺識別、分析、決策方面已有較多了解,反而對小腦中控制眼球運動、上丘腦中控制跳躍性視覺、腦干中融合視聽觸覺的機制不甚了解,“我們則希望在這方面有所突破,讓仿生視覺真正走向類腦智能。”
接近人眼之后,他們還將嘗試超越人眼。比如,張曉林團隊已在開展“鷹眼”研究。“鷹的眼球有兩個中心凹,深的一個可以單獨工作,從上千米的距離外看清目標,而淺的那個則需雙眼配合,在近距離產(chǎn)生縱深感,幫助老鷹更好地抓取獵物。”他說,這只是嘗試之一,“變色龍眼球可以分別轉(zhuǎn)動,或許可以讓仿生眼具有更多功能。”

張曉林在介紹全球唯一的全自動3D攝像系統(tǒng)
在上海找到志同道合者
雖然在全自動3D仿生視覺系統(tǒng)領(lǐng)域做得風(fēng)生水起,但張曉林已有3年不曾以第一作者的身份,在專業(yè)雜志上發(fā)表論文。“對于一個很多人還不相信的東西,做出來才是最有說服力的。”他因此將更多精力放在研制和專利保護上。
先在日本橫濱國立大學(xué)學(xué)了8年工程,又在東京醫(yī)科齒科大學(xué)從事了8年醫(yī)學(xué)相關(guān)工作,從2003年起,張曉林到東京工業(yè)大學(xué)開始仿生眼研究。2013年,他帶領(lǐng)團隊的6名博士一起回國,來到微系統(tǒng)所,開始人工智能仿生視覺的研究。
“這是一個跨好幾個學(xué)科的新領(lǐng)域,涉及醫(yī)學(xué)、腦科學(xué)、控制、圖像處理等等。”他說。
回國后,由于領(lǐng)域太新,沒有什么同行,張曉林在申請項目和經(jīng)費時,也遇到過不少尷尬,“即使發(fā)了論文,也很少有人引用,怎么也得不到高影響因子。”但他覺得,對一個真正創(chuàng)新的領(lǐng)域,剛開始總是少人關(guān)注,即使發(fā)了文章,影響力也要過很多年才能看出,所以先做實在事更緊要。
在上海的科創(chuàng)大環(huán)境中,他找到了不少志同道合者——上海“腦-智工程”項目打通了從基礎(chǔ)腦科學(xué)研究到類腦智能技術(shù)的聯(lián)系,這正是他所盼望的。在這個項目中,他負責(zé)視覺系統(tǒng),科大訊飛負責(zé)語音,寒武紀負責(zé)神經(jīng)網(wǎng)絡(luò)芯片……他說,深度學(xué)習(xí)可以讓人工智能視覺系統(tǒng)得到快速發(fā)展,在這里發(fā)展自己的事業(yè),的確找對了地方。
為未來市場而努力
采訪間隙,張曉林接了一個很長的電話,與人探討一個專利的價格問題。對于高級的智能視覺系統(tǒng),市場需求還只是初露端倪。
最近,CBA(中國男子籃球職業(yè)聯(lián)賽)公司找到張曉林,希望能將他的新技術(shù)用在監(jiān)控籃球比賽上。“有時一個球到底是否出界,現(xiàn)在的攝像系統(tǒng)無法快速變焦盯住籃球。”他說,用他的技術(shù)則可以做到。
3D電影拍攝成本高,主要因為要時刻保持兩臺攝像機的光軸落在同一平面上,才能形成立體視覺。“我們的設(shè)備可以自動調(diào)節(jié),拍攝的時間成本就下降到普通攝像機的水平。”張曉林說,他們已為上海戲曲工程提供了拍攝設(shè)備。
今后,這塊需求還會更多。比如,現(xiàn)在雙臂機器人已經(jīng)誕生,今后所從事的不再是流水線上的單一工作,而是需要揀選零件,進行不同的裝配,那么仿生立體視覺就很重要。又如無人汽車上的視覺系統(tǒng),也要能夠?qū)?fù)雜的路況進行判斷,尤其是遇到顛簸等情況。
不過張曉林也感嘆:“人才太難找了!”今年他把培養(yǎng)出的學(xué)生大部分留在了自己公司,開出了比市場平均水平更高的年薪。他希望,有更多人可以加入到這個領(lǐng)域中,盡管對學(xué)科交叉背景的要求很高,但為未來市場而努力,很值得。