嵌入式機(jī)器人視覺系統(tǒng)的開發(fā)已經(jīng)到達(dá)轉(zhuǎn)折點(diǎn)。各種各樣的設(shè)備不僅變得更加智能,而且變得更加了解在世界上所處的位置,伯克利設(shè)計(jì)技術(shù)有限公司(BDTI)總裁、最近成立的嵌入式視覺聯(lián)盟(EVA)創(chuàng)始人Jeff Bier表示。
這與成本迅速下降的傳感器——特別是圖像傳感器以及分析這些數(shù)據(jù)的處理邏輯有很大的關(guān)系。BDTI公司花了很長時(shí)間來建立數(shù)字信號處理器基準(zhǔn),最終發(fā)現(xiàn)某段時(shí)期內(nèi)總有一個(gè)主要的應(yīng)用驅(qū)動力,至少目前為止是這樣,Bier表示。“在20世紀(jì)90年代早期,主要驅(qū)動力是數(shù)字化無線技術(shù);在20世紀(jì)90年代末期,是消費(fèi)類數(shù)字音頻;在21世紀(jì)初,是消費(fèi)類數(shù)字視頻。”他指出,“嵌入式視覺有望成為下一個(gè)重要的驅(qū)動力。”
另外一個(gè)觀點(diǎn)是,20世紀(jì)80年代和80年代以前是DSP的軍事化應(yīng)用時(shí)代,而80年代以后的30年是DSP的工業(yè)與企業(yè)應(yīng)用時(shí)代,比如生產(chǎn)線和計(jì)算機(jī)監(jiān)控。
下一個(gè)時(shí)代無疑是促進(jìn)消費(fèi)的時(shí)代,比如游戲和汽車的電傳線控(drive-by-wire)等應(yīng)用。隨著應(yīng)用處理器性能的提高和成本的下降,潛在應(yīng)用將呈爆發(fā)式增長,Bier認(rèn)為。視覺系統(tǒng)在安全關(guān)鍵和救生應(yīng)用中早有使用,例如汽車上的車道偏離告警和碰撞避免系統(tǒng),能夠防止溺水事故的游泳池告警系統(tǒng)等。
Mobileye NV公司已經(jīng)能夠提供基于視覺的先進(jìn)駕駛輔助系統(tǒng)。公司成立于1999年,成功開發(fā)出了運(yùn)行在被稱為EyeQ的專有處理器上的專有圖像處理算法。EyeQ處理器最初是由意法半導(dǎo)體(ST)采用0.18um CMOS工藝為Mobileye公司制造的。芯片和軟件算法首先被賣給寶馬和沃爾沃等汽車OEM客戶。
大約2007年時(shí),上述解決方案就成為了汽車配件市場產(chǎn)品。解決方案架構(gòu)由2個(gè)32位ARM946E處理器內(nèi)核、4個(gè)視覺計(jì)算引擎(VCE)、1個(gè)多通道DMA和多個(gè)外設(shè)組成。其中一個(gè)ARM946E用于管理4個(gè)VCE、多通道DMA以及其它外設(shè)。4個(gè)VCE和另外一個(gè)ARM946E執(zhí)行諸如跟蹤和圖案分類等任務(wù)所要求的所有密集型視覺運(yùn)算。
Bier指出,對于從增強(qiáng)實(shí)景(augmented reality)到貼片機(jī)等無數(shù)應(yīng)用來說,嵌入式視覺“不是必須發(fā)明的一個(gè)事物,而是已經(jīng)有30或40年的實(shí)際學(xué)術(shù)研究成果可以借鑒。”《電子工程專輯》認(rèn)為手勢識別是值得期待的2011年十大技術(shù)之一,而微軟的Kinect的出現(xiàn)勢必打破機(jī)器人視覺格局。
Kinect是Xbox 360的3D運(yùn)動檢測附加產(chǎn)品。Xbox解決方案使用可見光譜圖像檢測、紅外檢測和本地處理的組合來判斷場景中的人物和深度,其硬件基本來自以色列公司PrimeSense。微軟開發(fā)的識別軟件則將信息融合進(jìn)了游戲。
今年6月,微軟宣布推出兼容Windows軟件開發(fā)套件的免費(fèi)beta版本Kinect。開發(fā)人員、學(xué)術(shù)研究人員和愛好者都可以使用這種開發(fā)套件創(chuàng)建相關(guān)應(yīng)用,并使用Kinect技術(shù)實(shí)現(xiàn)在Windows 7上運(yùn)行的深度檢測、人體運(yùn)動跟蹤以及語音和目標(biāo)識別功能。
嵌入式視覺聯(lián)盟(EVA)的成立則強(qiáng)調(diào)了這個(gè)行業(yè)轉(zhuǎn)折點(diǎn)的到來。
Bier認(rèn)為EVA聯(lián)盟將發(fā)揮三重作用:提高人們對這種技術(shù)潛力的理解;分享實(shí)用的技術(shù)訣竅,包括經(jīng)驗(yàn)證的解決問題的方法甚至算法和代碼;提供一個(gè)感興趣的各方都能聯(lián)網(wǎng)參與的論壇。“標(biāo)準(zhǔn)化肯定需要,也許標(biāo)準(zhǔn)化就是EVA的最終目標(biāo)之一。”Bier指出。
在所有各種計(jì)算機(jī)設(shè)備中包含圖像傳感器將帶來計(jì)算機(jī)視覺的“民主化”,使得每臺筆記本電腦成為潛在的開發(fā)平臺,Bier表示。“像OpenCV之類的東西對此起著推波助瀾的作用。”他指出。OpenCV(針對開源計(jì)算機(jī)視覺)是一個(gè)主要用于實(shí)時(shí)計(jì)算機(jī)視覺的編程函數(shù)庫。
OpenCV庫是Intel公司于1999年最早創(chuàng)建的,現(xiàn)在由機(jī)器人技術(shù)研究實(shí)驗(yàn)室和技術(shù)孵化企業(yè)Willow Garage有限公司提供支持,在開源伯克利軟件發(fā)布許可條件下可免費(fèi)使用。OpenCV包含500多個(gè)函數(shù),包括通用圖像處理、相機(jī)防抖、立體聲和3D功能、檢測、識別、適配、跟蹤和其它機(jī)器學(xué)習(xí)函數(shù)。
雖然OpenCV庫最早是由Intel開發(fā)的,但OpenCV是一種交叉平臺,擁有可在Windows、Linux、Android和MAC系統(tǒng)上運(yùn)行的C++、C、Python以及不久后還將增加的Java界面。Willow Garage公司擁有內(nèi)建OpenCV的機(jī)器人操作系統(tǒng)(ROS),也是PR2個(gè)人機(jī)器人的開發(fā)商。