
加拿大人工智能初創(chuàng)公司Maluuba日前就推出了一款機器學(xué)習(xí)系統(tǒng),可以讓計算機像人類一樣閱讀文章,理解小說故事的情節(jié)。
不同于圖片和聲音識別技術(shù),讓機器正確理解人類知識和語言更加困難。這也是人工智能遇到的重大挑戰(zhàn)之一。因為語言理解領(lǐng)域缺乏大規(guī)模標(biāo)記數(shù)據(jù)集,機器學(xué)習(xí)時,很難對該領(lǐng)域的相關(guān)環(huán)境進(jìn)行模擬。盡管互聯(lián)網(wǎng)上包含無數(shù)的網(wǎng)頁,上面擁有無數(shù)的文字內(nèi)容,但還沒有人能找到以機器能夠理解的形式將內(nèi)容輸給機器。簡單地說,機器還沒有掌握人類學(xué)習(xí)知識的方法。
因此,讓機器學(xué)會閱讀理解人類語言是一個里程碑式事件,也是真正人工智能應(yīng)該達(dá)到的目標(biāo)。谷歌、Facebook和IBM等公司也在關(guān)注機器學(xué)習(xí)閱讀理解能力。但從目前的測試結(jié)果看,這家加拿大的初創(chuàng)公司已經(jīng)領(lǐng)先谷歌等巨頭,走在了前面。
EpiReader對自然語言的理解超過谷歌、Facebook
Maluuba推出的系統(tǒng)名為EpiReader,研究人員設(shè)計這個系統(tǒng)的目的在于用來解決特定類型的理解任務(wù)。研究人員會將一段文字的默寫字詞抹去,EpiReader需要根據(jù)上下文語境來補全信息。據(jù)研究人員介紹,EpiReader使用了2層神經(jīng)網(wǎng)絡(luò),這是一種模擬人類大腦神經(jīng)元的計算機系統(tǒng)。第一層神經(jīng)網(wǎng)絡(luò)能讓系統(tǒng)基于對于段落的理解挑選可能存在的答案,第二層神經(jīng)網(wǎng)絡(luò)用來評估第一層給出的答案,并最終給出一個正確的回答。
Maluuba用了大量的文本對EpiReader進(jìn)行了測試。與去年谷歌DeepMind用CNN和《每日郵報》的30萬篇新聞稿,F(xiàn)acebook用98本兒童經(jīng)典讀物做文本測試相比,EpiReader測試的文本數(shù)量更多,能讓機器構(gòu)建起詞匯語義理解的框架。
從測試結(jié)果看,EpiReader在填空題中分別得到了74%和67.4%的準(zhǔn)確率。根據(jù)《the Verge》的報道,國內(nèi)許多人工智能的專家認(rèn)為,這個測試結(jié)果是目前所有機器學(xué)習(xí)語義理解中的最高分,打敗了谷歌的DeepMind,F(xiàn)acebook和IBM沃森在今年3月份公布的結(jié)果。
有趣的是,Maluuba還讓EpiReader閱讀了《權(quán)力的游戲》第5季中的部分章節(jié),EpiReader閱讀完后,迅速理解了故事內(nèi)容。當(dāng)工作人員問它,是誰刺死了John Snow(《權(quán)力的游戲》男主之一)時,機器直接給出了準(zhǔn)確的回答:守夜人?,F(xiàn)在如果你問蘋果手機的Siri助手,它可能還完全不知道你在說什么,從而將你推到搜索網(wǎng)頁來尋找答案。
除了《權(quán)力的游戲》,EpiReader還讀過《哈利波特與魔法石》,也能正確回答研究人員提出的問題。
“這樣的算法可以用到使用者手冊、病人病例記錄或者消費者服務(wù)的文件中。”Maluuba產(chǎn)品副總監(jiān)Mohamed Musbah在接受《MIT科技評論》采訪時說。
目前,該公司的產(chǎn)品已經(jīng)運用到消費類電子產(chǎn)品和設(shè)備制造商上。比如,LG 旗艦G系列手機的voicemate應(yīng)用就采用了Maluuba技術(shù)。2013年2月,Maluuba正式宣布向Windows Phone平臺遷移。Maluuba的Windows Phone 8版本擁有 Android 版本的大部分功能,例如可以搜索餐館、影院、新聞和企業(yè)(以及進(jìn)行語音購物)、設(shè)置鬧鐘、提醒和會議安排、打電話、發(fā)短信和郵件、指示方向和天氣,甚至還集成了Outlook日歷。
雖然功能與Siri、微軟的Cortana相似,但Maluuba的工作人員顯然不愿意自己被一個領(lǐng)域里的助手角色束縛。他們的目標(biāo)是能做出代替人類閱讀的程序,人類以后可以借助EpiReader,在任何地方找到想要的書籍,得出答案。
比起人工智能的圖像、語音識別,語義理解更有市場
“我們真的很想在EpiReader系統(tǒng)里融入人類更高的推理和閱讀理解能力,融入我們思考世界的方式。” Maluuba研發(fā)總監(jiān)Adam Trischler在接受媒體采訪時說。
Maluuba成立于2011年8月份,目前,公司在加拿大的蒙特利爾和滑鐵盧兩個地方設(shè)有研發(fā)實驗室。這兩個地方也是加拿大人工智能發(fā)展的重鎮(zhèn)。公司大部分的研究人員來自蒙特利爾大學(xué)和加拿大滑鐵盧大學(xué),兩個學(xué)校在計算機和深度學(xué)習(xí)兩個領(lǐng)域里的學(xué)術(shù)成就,聞名世界。
2015年8月,Maluuba 融資900萬加元(A輪)用于進(jìn)一步推進(jìn)深度學(xué)習(xí)研究。同年12 月,Maluuba在蒙特利爾開設(shè)了一個新的研發(fā)實驗室。其中有13名深度學(xué)習(xí)方向的研究人員。據(jù)Maluuba官網(wǎng)介紹,公司關(guān)注機器學(xué)習(xí)中的兩個細(xì)分研究領(lǐng)域:對話和機器理解。同時,也關(guān)心研發(fā)解決通用問題的人工智能,對解決真實世界問題更感興趣。他們相信自己能找出更好的人機交互方式。
“這種技術(shù)在未來可以接入用戶所有的交互過程中。”蒙特利爾大學(xué)機器學(xué)習(xí)算法研究所負(fù)責(zé)人,同時也是Maluuba的顧問Yoshua Bengio教授在接受《the Verge》采訪時說,“Maluuba的技術(shù)非常特別,理解別人說什么、寫什么,這個潛在的市場非常巨大,甚至比計算機視覺處理還大。我認(rèn)為,這是我們?nèi)绾闻c計算機交互的方式,未來它會無處不在。”