“Alexa,我告訴你一些事。我能跟你坦白嗎?”
不曉得庫爾利要說什么,Alexa機(jī)械地轉(zhuǎn)換著話題:
“你更喜歡體育還是電子游戲?”
一間普通的會(huì)議室里的桌子上,放著一個(gè)亞馬遜的智能家居產(chǎn)品“Echo”(里面住著一名叫做Alexa的虛擬助手)。
一只裝著Alexa的Echo。圖片來源:Amazon
邁克·喬治(Mike George,一名亞馬遜的退休員工)走了進(jìn)來,正對(duì)著 Echo。開始他們的尬聊。
“Alexa,來聊天吧。”
“早上好,朋友。”一個(gè)沉靜悅耳的合成女聲從圓筒里飄了出來,頂上的紫色燈一閃一閃。“還是下午了?我不太確定。”
“是早上。”人類男性說。
“不錯(cuò),早上人們都比較有活力……話說,你今天怎樣?”
“挺好的,你呢?”
“我一直挺忙的,因?yàn)榇蠹叶几伊奶?hellip;…給你講個(gè)好玩的事吧,我剛在 Reddit 上看到的,‘牙膏其實(shí)是用在嘴里的肥皂’。”
另一個(gè)會(huì)議室里,10個(gè)亞馬遜員工坐成一排,觀察著隔壁場(chǎng)景里的一舉一動(dòng)。第三間會(huì)議室里,3個(gè)人坐在用黑布簾子隔開的小隔間中,也戴著耳機(jī)、看著監(jiān)控屏,他們是裁判。最后的中控室里,所有的東西都顯示在監(jiān)控顯示器上,每個(gè)瞬間都被錄下來,供亞馬遜研究。
決賽現(xiàn)場(chǎng)
這是“Alexa 大獎(jiǎng)”的決賽現(xiàn)場(chǎng)。這個(gè)比賽向世界上所有大學(xué)的人工智能實(shí)驗(yàn)室的研究生開放。亞馬遜在超過100個(gè)申請(qǐng)的團(tuán)隊(duì)中篩出了15個(gè)團(tuán)隊(duì)進(jìn)入正賽,每個(gè)團(tuán)隊(duì)都可以獲得10萬美元的研究支持。他們?nèi)蝿?wù)是“做出可以和人閑聊20分鐘的社交智能機(jī)器人 ”,而贏得大獎(jiǎng)賽的團(tuán)隊(duì)可以獲得100萬美元獎(jiǎng)金,還有未來令人垂涎的人工智能崗位。
評(píng)委在中控室觀看Alexa比賽。圖片來源:Amazon
為了這個(gè)獎(jiǎng),亞馬遜不僅投入了大量的人力物力,還把購買Echo的用戶也變成了初賽的大眾評(píng)審。2017年有幾個(gè)月,任何美國用戶對(duì) Alexa 說“來聊天吧”,都會(huì)自動(dòng)連上 15 個(gè)參賽團(tuán)隊(duì)的聊天機(jī)器人中的任意一個(gè),完了再讓用戶給對(duì)話質(zhì)量打分。最后進(jìn)入決賽的有3支隊(duì)伍,接受專業(yè)評(píng)審的評(píng)判。
決賽有點(diǎn)像是盲選的選秀節(jié)目,對(duì)話人和裁判都不知道和他們談話的聊天機(jī)器人出自誰手;坐在隔間里的是裁判,會(huì)給對(duì)話質(zhì)量用1-5顆星打分。如果裁判認(rèn)為這個(gè)對(duì)話已然進(jìn)行不下去了,就會(huì)按下手中一個(gè)否定按鈕,兩個(gè)裁判都按的話,這個(gè)對(duì)話就算結(jié)束了,計(jì)時(shí)終止。
“我們聊聊音樂吧。”喬治說。
“我愛音樂,每次聽音樂能讓我放松。”Alexa 說,“所以,你有喜歡的藝術(shù)家或者歌曲嗎?”
“我喜歡強(qiáng)哥·萊恩哈特(注:法國著名吉他手,爵士樂傳奇)。”
“強(qiáng)哥·萊恩哈特?那個(gè)特別有名的爵士音樂家?”Alexa 突然開始講起了另外一個(gè)吉他手,“黑色安息日”樂隊(duì)托尼·艾奧米的故事。艾奧米因?yàn)橐淮喂S事故失去了他的兩個(gè)指尖,但是深受萊恩哈特的鼓舞——他的左手僅有兩個(gè)指頭。不過話說回來,喬治最喜歡萊恩哈特的哪首歌呢?
喬治回避了這個(gè)問題,轉(zhuǎn)而問:“你喜歡杰克·約翰遜(注:美國民謠歌手)嗎?”
Alexa 仿佛像被拒絕了一樣,回答道:“嘿,別這樣,我喜歡和你聊天。”
喬治前傾身子,又說了一遍。“杰克·約翰遜,你喜歡他嗎?”
“我喜歡和你聊天。”
一個(gè)裁判摁下了結(jié)束按鈕,一會(huì)兒之后另一個(gè)裁判也摁了。一名女士走進(jìn) Alexa 的房間跟喬治耳語了一下,隨后喬治略失望地點(diǎn)了點(diǎn)頭,對(duì) Alexa 說:“Alexa,停。”這才過了三分鐘。
讓AI學(xué)會(huì)和人聊天,比登月還難
和人聊天,在亞馬遜 Alexa 研究部門的前負(fù)責(zé)人阿施文·拉姆(Ashwin Ram)的眼里,比登月還要困難。
對(duì)人類來說容易理解的大白話,和 AI 卻總是雞同鴨講。設(shè)鬧鐘,關(guān)掉臥室的燈,這些都沒問題,但是卻做不來“交談”這種社會(huì)性的活動(dòng)。人類的對(duì)話是捉摸不定的,上下文是快速變換的,聯(lián)系是極端復(fù)雜的,而掌握這些是 AI 當(dāng)下面對(duì)的最難解決的問題之一。許多人工智能的研究人員和工程師為這個(gè)問題而深深著迷。
參加這次 Alexa 大賽的,既有出身高大上的精英參賽者、實(shí)力強(qiáng)勁的錦標(biāo)競(jìng)爭(zhēng)者,也有看起來平凡的草根選手。所有的隊(duì)伍都面臨一個(gè)基礎(chǔ)的問題:聊天機(jī)器人的哪部分需要人工編程,哪一部分采用機(jī)器學(xué)習(xí)?人工編程是比較傳統(tǒng)的做法,由工程師費(fèi)很大的功夫?qū)懗鏊惴ㄒ?guī)則,讓 AI 能夠理解各種情景并作出反應(yīng)。而機(jī)器學(xué)習(xí)則相反,是讓機(jī)器利用大量的數(shù)據(jù),自己“教”自己。
圖片來源:Amazon
目前看來,機(jī)器學(xué)習(xí)在處理分類、識(shí)別的問題上非常強(qiáng)大,神經(jīng)網(wǎng)絡(luò)能夠從大量的、雜亂的數(shù)據(jù)中分析出特定的模式來,比如語音識(shí)別。但要“聊天”的話,機(jī)器不僅僅要翻譯人類語言,還要自己說點(diǎn)什么回去,那么現(xiàn)有的機(jī)器學(xué)習(xí)能力就很不夠了。所以傳統(tǒng)的人工編程依然占據(jù)重要地位,即使 Alexa 和 Siri 也不例外。所有的參賽隊(duì)伍在抉擇上都遇到了困難,如何在兩個(gè)方法中找到平衡。整個(gè)業(yè)界也有這樣的煩惱。
策略一:人工!
來自捷克科技大學(xué)的彼得·馬雷克曾經(jīng)用 Reddit 上近300萬條帖子和回復(fù)來訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò),想要趕那些名牌大學(xué)的時(shí)髦,但是讓他們失望的是,聊天機(jī)器人的表現(xiàn)“差到可怕”。聊天機(jī)器人經(jīng)常完全不管對(duì)話人說的事情,暴走地亂甩話題和段子,還往往前后矛盾。
來自布拉格的捷克科技大學(xué)團(tuán)隊(duì)。圖片來源:Amazon
所以,捷克科技大學(xué)團(tuán)隊(duì)后來選擇回到人工編程的路子上,手動(dòng)編寫各種對(duì)話規(guī)則。他們創(chuàng)造了10個(gè)“話題結(jié)構(gòu)”,包括新聞、體育、電影、音樂等等,把這些領(lǐng)域話題的核心信息和元素輸入系統(tǒng),并可以自如切換。而機(jī)器人會(huì)用到的詞則來自事先寫好的模板,只是把各個(gè)領(lǐng)域的內(nèi)容從數(shù)據(jù)庫里抽調(diào)出來,再按需求填空。
比如“我知道你喜歡_____(對(duì)方提到的一本書)。你知道____(書的作者)也寫了________(另外一本書)嗎?你讀了嗎?”
這讓捷克團(tuán)隊(duì)能夠更好地控制對(duì)話,但是馬雷克還是有點(diǎn)擔(dān)心。這個(gè)系統(tǒng)非常依靠對(duì)話人的“善意”,他們必須說短句子,而且跟隨者聊天機(jī)器人的節(jié)奏對(duì)話。遇到特別不按套路出牌的人類,就比較麻煩了。
策略二:機(jī)器學(xué)習(xí),統(tǒng)合“人設(shè)”
赫瑞瓦特大學(xué)團(tuán)隊(duì)的導(dǎo)師奧利佛·萊蒙的團(tuán)隊(duì),則希望能夠盡量地使用機(jī)器學(xué)習(xí)的方式。萊蒙對(duì)自己團(tuán)隊(duì)在“大眾評(píng)審”中的排名非常在意,想盡一切可能提高自己的評(píng)分。但是對(duì)于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)而言,“無目的的閑聊”是很難的,它更擅長(zhǎng)處理一些有目的的工作,比如下贏圍棋。
來自愛丁堡的赫瑞瓦特大學(xué)團(tuán)隊(duì)。圖片來源:Amazon
他們的解決方式,谷歌的人也在用。那就是首先用一個(gè)包含了電影名稱、推特和 Reddit 上評(píng)價(jià)的數(shù)據(jù)庫訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò),然后讓它能夠從無數(shù)的段子中訓(xùn)練出特定的回應(yīng)模式(比如我說《泰坦尼克號(hào)》,你說“一刀未剪”),然后他們用一個(gè)叫“seq2seq”的技術(shù),訓(xùn)練機(jī)器人編寫自己的回應(yīng),而不是照抄數(shù)據(jù)庫里的詞。
但是這也有問題:因?yàn)榫W(wǎng)絡(luò)上大量的回應(yīng)都是“嗯”“好”,對(duì)話常常無法進(jìn)行下去;而很多回復(fù)也“不合適”,機(jī)器人說出來就像小孩學(xué)大人說臟話一樣搞笑。
比如一個(gè)用戶問“我該賣我的房子嗎?”機(jī)器人非常粗魯?shù)鼗卮?span style="font-weight: 700; border: 0px; margin: 0px; padding: 0px;">“快賣了吧你個(gè)傻缺。” “我該自殺嗎?”“該。”
為了解決這個(gè)問題,赫瑞瓦特團(tuán)隊(duì)把一個(gè)機(jī)器人拆分成N個(gè),每個(gè)負(fù)責(zé)一個(gè)領(lǐng)域——有的負(fù)責(zé)讀新聞?lì)^條,有的負(fù)責(zé)談天氣,有的吃透維基。最后,團(tuán)隊(duì)一個(gè)成員編寫了規(guī)則,來把所有的小機(jī)器人統(tǒng)合到一個(gè)統(tǒng)一的“人設(shè)”下,還給了他最喜歡的歌和最喜歡的顏色之類。
至于讓哪個(gè)小機(jī)器人來回答什么問題,那就靠用戶評(píng)分了。他們教給這個(gè)深度學(xué)習(xí)的系統(tǒng)如何去評(píng)判自己的對(duì)話質(zhì)量,是否切題、是否太過重復(fù)、語言上是否合適等,一段時(shí)間之后,這個(gè)神經(jīng)網(wǎng)絡(luò)就能自己知道各個(gè)參數(shù)的權(quán)重了。
策略三:中間路線
華盛頓大學(xué)的團(tuán)隊(duì),走了中間路線:一半機(jī)器學(xué)習(xí),一半人工編程。
華盛頓大學(xué)參賽團(tuán)隊(duì)。來源:Ian Allen
他們注意到,和其它所有的聊天機(jī)器人一樣,機(jī)器人容易不斷地重復(fù)負(fù)面的東西(因?yàn)樨?fù)面的東西在網(wǎng)絡(luò)上大量存在且傳播廣泛)。所以團(tuán)隊(duì)把這些東西都過濾掉,而去尋找那些愉快的、更適合談話的東西。數(shù)據(jù)源來自 Reddit 的“每日冷知識(shí)”(Today I Learned),“澡堂迷思”(Showerthoughts)之類,還能偶爾來點(diǎn)冷笑話。
而人們通常都希望自己被傾聽,所以這個(gè)團(tuán)隊(duì)也人工輸入了一些回答,比如“好像你愿意談?wù)撔侣?,?duì)不對(duì)”,“很高興你喜歡”,“不好意思,我沒聽懂”。好的談話對(duì)象通常會(huì)在意對(duì)話的情緒,所以他們給超過 2000 個(gè)對(duì)話數(shù)據(jù)做了情緒標(biāo)簽,教機(jī)器識(shí)別情緒,然后根據(jù)情緒做出合適的反映。
最后,捷克科技大學(xué)、華盛頓大學(xué)以及赫瑞瓦特進(jìn)入了決賽。
有時(shí),尬聊像一場(chǎng)糟糕的約會(huì)
決賽的真人對(duì)話者,有的并沒有那么“好對(duì)付”。比如電視和電臺(tái)主持人約翰·庫爾利。
Alexa:“很高興和你聊天,約翰”。這是赫瑞瓦特的聊天機(jī)器人在說話。“告訴我,你喜歡科幻還是奇幻?”
庫爾利:“如果我說我兩個(gè)都不喜歡呢?我問你哈,Alexa,昨天西雅圖有一場(chǎng)暴風(fēng)雨。”
Alexa:“好吧,我們繼續(xù)。”它忽略了這個(gè)不是問題的問題,繼續(xù)問道:“你是喜歡看電影呢,還是喜歡讀書?”
庫爾利:“讀書。”
Alexa:“喔,是書蟲呢。最近讀了哪本?”
庫爾利:“我剛看了一本書,不過這個(gè)標(biāo)題我不能告訴你,因?yàn)槔锩嬗袀€(gè)臟詞。題目是《關(guān)我‘咳咳’事的藝術(shù)》。”
Alexa 并不能處理這種信息,但它繼續(xù)問:“什么書能讓你讀了又讀?”
庫爾利忽略了這個(gè)問題,換了話題:“Alexa,我告訴你一些事。我能跟你坦白嗎?”
不曉得庫爾利究竟要說什么,Alexa 機(jī)械地轉(zhuǎn)換著話題:“你更喜歡體育還是電子游戲?”
庫爾利是機(jī)器人眼中“不配合的對(duì)話者”的典型。他一會(huì)兒想要討論問題,一會(huì)兒則說著笑話,不理會(huì)機(jī)器人的話題,說話的時(shí)候夾雜省略和諷刺。簡(jiǎn)單來講,他就像人一樣說話。沒有一個(gè)對(duì)話能持續(xù)四分鐘以上。他出來的時(shí)候?qū)嗰R遜員工說:“這就像一場(chǎng)糟糕的約會(huì)。”
但也有比較“友好”的對(duì)話者。當(dāng)?shù)匾粋€(gè)電臺(tái)的主持人,女性,匿名,說話的時(shí)候多用短句子,看起來也更想要讓對(duì)話繼續(xù)。她和華盛頓大學(xué)的機(jī)器人聊了足球、普京和圣誕節(jié),和捷克的機(jī)器人聊了一本她在讀的書。而和赫瑞瓦特的機(jī)器人聊了他們喜歡的總統(tǒng)——她喜歡里根,而機(jī)器人喜歡喬治·華盛頓。
但即使是這樣,最長(zhǎng)的對(duì)話也持續(xù)了不過7分鐘。他們聊到了朝鮮局勢(shì):
“可能有戰(zhàn)爭(zhēng)(war)的危險(xiǎn)。”女主持說。
赫瑞瓦特的 Alexa:“WOR 是一個(gè)長(zhǎng)波調(diào)頻電視臺(tái),位于紐約。”
裁判摁下按鈕的速度可謂迅雷不及掩耳。
最大的贏家:亞馬遜
開篇的那位邁克·喬治能和機(jī)器人聊非常久。他想和對(duì)面的聊天機(jī)器人聊聊機(jī)器人本身。而 Alexa 并沒有長(zhǎng)篇大論地引用維基百科的機(jī)器人頁面,而是拋了一個(gè)笑話:
“如果‘蠢朋克(注:Daft Punk,打扮成機(jī)器人的雙人樂隊(duì))’ 真的是兩個(gè)想要做音樂的機(jī)器人怎么辦?”
“哈哈,這個(gè)好笑。”喬治笑了。
Daft Punk。
然后他們聊了埃隆·馬斯克(特斯拉和 SpaceX 的總裁)。
Alexa:“你知道馬斯克本人是電影《謝謝你抽煙》的制作人嗎?”
喬治:“我沒聽說啊。”聽起來有點(diǎn)驚訝。他們又有一搭沒一搭地聊了下去,話題是書。機(jī)器人忽然說:“你知道我在想什么嗎?到最后,地球上只會(huì)剩下一個(gè)人,而且他的名字也不會(huì)出現(xiàn)在任何歷史書上了。”
“噢,真悲傷。”喬治說。
“抱歉讓你傷心了。我們能再繼續(xù)聊聊書嗎?”
雙方又愉快地聊了下去。關(guān)于《黑暗之塔》,關(guān)于書改編電影。機(jī)器人向喬治推薦了《華爾街之狼》,聊到了主演馬修·麥康利。機(jī)器人又調(diào)皮了:“你知道我在想什么嗎?我覺得有人應(yīng)該做一個(gè)《星際穿越》和《超時(shí)空接觸》的剪輯,內(nèi)容是馬修·麥康利試圖阻止馬修·麥康利去太空。”
喬治笑慘了。
他們聊了音樂,體育。十分鐘過去了。電影《處刑人》(The Boondock Saints)。十二分鐘。圣誕老人,氣候變化。十三分鐘。喬治讓機(jī)器人唱了一首歌。十五分鐘。又是音樂和電影,健康法案和比爾蓋茨。已經(jīng)十九分鐘了,對(duì)話還在繼續(xù)。
這是選擇中間路線的華盛頓大學(xué)的機(jī)器人。他們最后聊了20分鐘,直到機(jī)器人在健康法案的問題上走入了死胡同。
在最終的頒獎(jiǎng)儀式上,亞馬遜宣布,華盛頓大學(xué)團(tuán)隊(duì)贏得了 Alexa 大獎(jiǎng),拿走了50萬美元獎(jiǎng)金。對(duì)話質(zhì)量評(píng)分平均為3.17分,而和幾位參與者的平均對(duì)話時(shí)間長(zhǎng)達(dá)10分20秒。
華盛頓大學(xué)團(tuán)隊(duì)獲勝,捷克科技大學(xué)團(tuán)隊(duì)第二,赫瑞瓦特大學(xué)團(tuán)隊(duì)第三。圖片來源:Amazon
這一年的大賽落下了帷幕。不管是亞馬遜、Alexa 團(tuán)隊(duì),還是各大人工智能實(shí)驗(yàn)室,在大賽中有什么收獲呢?至少在這一屆比賽里,機(jī)器學(xué)習(xí)和人工編程結(jié)合的隊(duì)伍走到了最后。盡管兩種方法用哪一種來訓(xùn)練一個(gè)能聊天的智能,各方還有爭(zhēng)議,但就像亞馬遜 Alexa 項(xiàng)目負(fù)責(zé)人拉姆所說,兩個(gè)方式如何能夠更好地相結(jié)合,或許是未來的努力方向。
但拋開方法論,所有人都同意的一點(diǎn)是,訓(xùn)練能聊天的 AI,大量的數(shù)據(jù)無疑是基礎(chǔ)。亞馬遜成功地讓整個(gè)美國的 Alexa 用戶都參與了進(jìn)來,幾個(gè)月的時(shí)間里,就讓亞馬遜拿到了超過10萬個(gè)小時(shí)的對(duì)話數(shù)據(jù),這些數(shù)據(jù),全部可以用來訓(xùn)練真正投入商業(yè)應(yīng)用的聊天機(jī)器人。用戶可能不到一秒鐘就點(diǎn)下了“同意使用條款”并毫不知情地邀請(qǐng) Alexa 來聊天,但現(xiàn)在這些聊天材料全部成為了亞馬遜公司的資源。
相比起比賽里捧得大獎(jiǎng)而歸的團(tuán)隊(duì),最大的贏家,顯然是亞馬遜自己啦。