在上個月于倫敦舉行的深度學習大會上,有一個特別值得關(guān)注的主題:謙卑,或者說需要謙卑。
Facebook開源的圖像識別工具
包括谷歌在內(nèi)的許多公司都信誓旦旦地宣稱,我們正生活在一個“以AI為先的時代”,機器學習也在語音和圖像識別等領(lǐng)域取得了突破,但是身在AI研究最前沿的人經(jīng)常指出,人類在這方面仍有大量工作要做。僅僅因為我們擁有了聽上去像電影中會說話的虛擬助手,并不意味著我們距離創(chuàng)造真正的人工智能更近一步。
我們在人工智能研究領(lǐng)域還面臨著諸多挑戰(zhàn),比如需要海量數(shù)據(jù)來支持深度學習系統(tǒng);我們還不能打造出不止擅長一項任務(wù)的AI;我們對這些系統(tǒng)的工作原理缺乏認識。2016年,機器學習創(chuàng)造了一系列極為出色的工具,但這些工具難以具體解釋,訓練費用高昂,即便對創(chuàng)造者來說,它們往往也像是謎一般的存在。下面就讓我們來詳細闡述一下我們在人工智能領(lǐng)域面臨的三大挑戰(zhàn)。
數(shù)據(jù)、數(shù)據(jù),還是數(shù)據(jù)
眾所周知,人工智能需要數(shù)據(jù)來了解世界,但我們往往會忽視數(shù)據(jù)多少的重要性。英國謝菲爾德大學機器學習教授、亞馬遜人工智能團隊成員尼爾·勞倫斯(Neil Lawrence)指出,若想理解概念或識別某項功能,這些系統(tǒng)不僅需要比人類更多的信息,而且需要的信息數(shù)量更是多出人類數(shù)十萬倍。
勞倫斯說:“如果你看一看深度學習在哪些領(lǐng)域的應(yīng)用取得了成功,那么會發(fā)現(xiàn)這些往往是我們需要大量數(shù)據(jù)的領(lǐng)域。”例如,在語音和圖像識別領(lǐng)域,谷歌和Facebook等科技巨頭都擁有海量數(shù)據(jù)(如安卓設(shè)備上的語音搜索),令他們可以輕松開發(fā)有用的工具。
勞倫斯稱,當前,數(shù)據(jù)就像是工業(yè)革命早期的煤炭。他還以湯瑪斯·紐科門(Thomas Newcomen)為例來說明這一點。紐科門是英國人,在1712年發(fā)明了以煤為燃料的原始蒸汽機,比詹姆斯·瓦特(James Watt)發(fā)明先進蒸汽機早了大概60年。紐科門發(fā)明的蒸汽機并不太好,相比瓦特蒸汽機,效率低,費用高。這意味著,它只能在煤田使用——煤田有足夠多的燃料來克服蒸汽機的諸多不利條件。

Facebook開源的圖像識別工具
勞倫斯表示,如今世界各地存在著數(shù)百個“紐科門”,他們正在開發(fā)自己的機器學習工具。這些工具可能具有革命性,但沒有數(shù)據(jù)來支撐它們,所以我們將永遠無法知道結(jié)果如何。谷歌、Facebook和微軟等科技巨頭就好像是今天的“煤礦”。他們擁有豐富的數(shù)據(jù),也有經(jīng)濟能力來運行效率不高的機器學習系統(tǒng)并加以改善。
規(guī)模更小的創(chuàng)業(yè)公司可能有不錯的創(chuàng)意,但如果沒有數(shù)據(jù)支撐,他們就無力跟進科技巨頭在這個領(lǐng)域的動作。如果看一看你難以獲得數(shù)據(jù)的其他領(lǐng)域,會發(fā)現(xiàn)問題甚至更嚴重。以醫(yī)療保健為例,人工智能正被用于機器視覺任務(wù),如識別X光片中的腫瘤,但這個領(lǐng)域的數(shù)字化數(shù)據(jù)卻很少。
正如勞倫斯所指出的,問題的棘手之處就在于,“迫使人們不厭其煩地去獲取數(shù)據(jù),被普遍認為是不道德的事情”。勞倫斯表示,這里的問題不是尋找分發(fā)數(shù)據(jù)的途徑,而是如何讓深度學習系統(tǒng)變得更高效,可以在數(shù)據(jù)更少的情況下使用。就如同瓦特蒸汽機相比紐科門蒸汽機有了巨大突破一樣,人工智能的研究若想取得突破,可能也需要60年。
需要具備多任務(wù)處理能力
深度學習面臨的另一個重大挑戰(zhàn)是,當前所有的AI系統(tǒng)基本上就是“紙上談兵”。據(jù)谷歌DeepMind研究小組科學家拉伊亞·哈德塞爾(Raia Hadsell)介紹,一旦經(jīng)過訓練,它們可以極為高效地應(yīng)對一些任務(wù),比如識別貓咪或是玩Atari游戲,但是,“目前世界上沒有神經(jīng)網(wǎng)絡(luò)或任何方法在經(jīng)過訓練后,可以識別物體和圖像,玩《太空侵略者》游戲,聽音樂。”神經(jīng)網(wǎng)絡(luò)(Neural network)是深度系統(tǒng)系統(tǒng)的基本組成部分。
實際上,問題比實際情況還嚴重。谷歌DeepMind團隊去年2月份宣布,它已經(jīng)開發(fā)了一種能在49個游戲中勝出的系統(tǒng),雖然這肯定是巨大的科學成就,但每次擊敗某款游戲,該系統(tǒng)都需要再次進行訓練,以便在下一次的較量中勝出。正如哈德塞爾所指出的,你不能同時試著學會所有不同的游戲,因為不同游戲的規(guī)則會相互干擾。你可以一次學習一個游戲規(guī)則,但最終會忘了前幾個游戲的規(guī)則。“若想實現(xiàn)通用型人工智能,我們就需要一種能學會多任務(wù)處理的東西,”哈德塞爾說,“但是,我們現(xiàn)在甚至不能掌握多個游戲規(guī)則。”
解決這一問題就需要一種稱為“漸進神經(jīng)網(wǎng)絡(luò)”(progressive neural network)的東西——這意味著要將不同深度學習系統(tǒng)連接起來,令其可以傳遞某些信息片段。今年6月份,哈德塞爾的團隊就這一話題發(fā)表了一篇論文,稱他們開發(fā)的漸進神經(jīng)網(wǎng)絡(luò)可以適應(yīng)規(guī)則略有不同的多款《Pong》游戲,而且適應(yīng)的速度遠超正常的神經(jīng)網(wǎng)絡(luò)——后者必須從零開始了解每個游戲的規(guī)則。

漸進神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)
這是一種頗具前景的方法,在最新實驗中,它甚至可以應(yīng)用于機械臂——將機械臂的學習過程從過去的幾周,縮短為現(xiàn)在的一天。然而,這種方法也存在諸多嚴重的短板,哈德塞爾稱漸進神經(jīng)網(wǎng)絡(luò)不能持續(xù)地在“記憶”中增加新任務(wù)。她說,如果你將幾條鐵鏈子連在一起,那么整條鏈子遲早“變得過于龐大,難以駕馭”。到那個時候,我們正在管理的不同任務(wù)基本上都是相同的——打造一種智力相當于人類的系統(tǒng),可以寫詩、解決微分方程、設(shè)計椅子,這種系統(tǒng)也將成為與眾不同的東西。
缺乏對AI內(nèi)部機制的了解
另一個重大挑戰(zhàn)是,理解人工智能如何得出它們的結(jié)論。對于外行人來說,神經(jīng)系統(tǒng)通常是謎一般的存在。雖然我們了解了如何將它們連接起來的辦法,也了解了經(jīng)過這些系統(tǒng)的信息,但這些系統(tǒng)為何會作出某些決定,原因往往是我們難以理解的。
弗吉尼亞理工學院的一次實驗,就充分展現(xiàn)了這一挑戰(zhàn)。研究人員給神經(jīng)網(wǎng)絡(luò)開發(fā)了一種眼部追蹤系統(tǒng),將計算機最先看到的像素記錄下來。研究人員將一張臥室的神經(jīng)網(wǎng)絡(luò)照片拿給該系統(tǒng)看,然后問:“蓋住窗戶的是什么東西?”他們發(fā)現(xiàn),該系統(tǒng)并沒有看窗戶,而是朝地上看了看。
接著,如果發(fā)現(xiàn)了一張床,它會回答“窗簾蓋住了窗戶”。該系統(tǒng)碰巧給出了正確答案,但這只是因為它接受訓練時的數(shù)據(jù)有限。根據(jù)研究人員向它展示的照片,神經(jīng)網(wǎng)絡(luò)得出了這樣的一個結(jié)論,即如果是在臥室中,那么窗戶上一定要窗簾。所以,只要看到床,該系統(tǒng)就不會再看第二眼了——它已經(jīng)看到過窗簾了。當然,這合乎邏輯,但卻是很愚蠢的做法。許多臥室根本就沒有窗簾!
眼部追蹤只是一個揭示AI內(nèi)部機制的方法,另一個方法可能是給深度學習系統(tǒng)注入更多的連貫性。倫敦大學帝國理工學院認知機器人科學教授莫里·沙納漢(Murray Shanahan)表示,實現(xiàn)這一目的的途徑是,重新采用一種名為“有效的老式人工智能”( GOFAI)的傳統(tǒng)機器學習方法。這種方法是基于一個假想提出的,即腦海中發(fā)生的東西可以縮減為基本的邏輯,讓世界由眾多復(fù)雜的符號來定義。通過將這些表示動作、事件和物體的符號結(jié)合起來,你基本上可以形成自己的看法。
沙納漢建議,我們應(yīng)該吸取GOFAI的符號描述方法,然后與深度學習結(jié)合起來。這些系統(tǒng)將成為人工智能系統(tǒng)了解世界的一個起點,而不是不斷提供數(shù)據(jù),等待其識別某些圖像。他說,這種辦法不僅可以解決AI的透明度問題,而且還能解決哈德塞爾提出的轉(zhuǎn)移學習成果的問題。
沙納漢說:“可以這樣說,《Breakout》類似于《Pong》,因為它們都得到了槳和球,但堪比人類的認知能力將它們以更大的規(guī)模連接起來,就像是原子結(jié)構(gòu)和太陽系結(jié)構(gòu)之間的連接一樣。”沙納漢及其團隊正在開發(fā)一種新的方法(他們稱之為“深度符號增強學習法”),并且公布了一些實驗成果。
這項研究目前仍然處于初級階段,發(fā)現(xiàn)它是否可以應(yīng)用于更大的系統(tǒng)和不同類型的數(shù)據(jù),將更加具有說服力。但是,它很有可能會演變?yōu)楦嗟臇|西。畢竟,在研究人員近年來開始挖掘廉價數(shù)據(jù)和大量處理能力之前,深度學習本身就是AI當中一個不受垂青的部分。也許,現(xiàn)在到了AI迎來再一次爆發(fā),在新環(huán)境下大展身手的時候了。