熱搜： 佳士科技 irobot 工業(yè)機(jī)器人機(jī)器人 ABB 機(jī)器人產(chǎn)業(yè)聯(lián)盟發(fā)那科庫(kù)卡碼垛機(jī)器人機(jī)械手

谷歌DeepMind研究員Laurent Orseau和Stuart Armstrong：人工智能“死亡開關(guān)”很重要

日期：2016-06-07 來源：motherboard.vice 作者：lx 評(píng)論：0

標(biāo)簽：

　　人工智能不能有“殺人之心”，否則，有意識(shí)的超級(jí)智能將會(huì)變得非常危險(xiǎn)。雖然這么說會(huì)讓有些人不贊同，但事實(shí)上，現(xiàn)在的人工智能已經(jīng)很危險(xiǎn)了。如果機(jī)器能夠根據(jù)“現(xiàn)實(shí)世界輸入”進(jìn)行學(xué)習(xí)，并根據(jù)現(xiàn)實(shí)情況調(diào)整他們的行為，那么勢(shì)必會(huì)存在一定風(fēng)險(xiǎn)，那就是機(jī)器有可能會(huì)學(xué)習(xí)一些錯(cuò)誤的事情，而一旦機(jī)器能夠?qū)W習(xí)錯(cuò)誤的事情，他們就會(huì)做出錯(cuò)誤的事情。

　　為了解決這個(gè)問題，谷歌DeepMind和人類未來學(xué)院研究院Laurent Orseau與Stuart Armstrong合作開發(fā)了一個(gè)“安全可中斷的人工智能”全新架構(gòu)，并且在第32界人工智能不確定性大會(huì)上發(fā)表了相關(guān)論文。換句話說，他們的系統(tǒng)可以確保機(jī)器無(wú)法學(xué)會(huì)抵制人類介入其學(xué)習(xí)過程。

　　Orseau和Armstrong認(rèn)為，“安全可中斷人工智能框架”必須要依靠一種機(jī)器學(xué)習(xí)輔助技術(shù)，也就是業(yè)界所稱的強(qiáng)化學(xué)習(xí)技術(shù)。這里，一個(gè)“代理（機(jī)器）”可以按照所謂獎(jiǎng)勵(lì)功能來進(jìn)行學(xué)習(xí)，也即是這個(gè)“代理”將根據(jù)某個(gè)預(yù)定目標(biāo)的完成情況來評(píng)估每一個(gè)可能的行為——行為結(jié)果距離目標(biāo)越近，“獎(jiǎng)勵(lì)”就會(huì)越多。（所謂獎(jiǎng)勵(lì)，其實(shí)是一種有趣的比喻，可以被想象成那些被編好機(jī)器學(xué)習(xí)程序的機(jī)器想要等到的東西；比如，我們不妨讓機(jī)器知道積分或餅干是他們想要的，因此他們必須要實(shí)現(xiàn)行為目標(biāo)最大化）

　　機(jī)器強(qiáng)化學(xué)習(xí)有一個(gè)優(yōu)勢(shì)，為了達(dá)到某個(gè)程度的獎(jiǎng)勵(lì)，人類程序員可能不會(huì)嘗試每一種可能的方法，而一個(gè)機(jī)器學(xué)習(xí)“代理器”則可能探索一些捷徑，幫助機(jī)器最大化獎(jiǎng)勵(lì)，不過這種方式也有短板，就是機(jī)器學(xué)習(xí)找到的捷徑，可能并不是人類最希望得到的。人類程序員則可以權(quán)衡風(fēng)險(xiǎn)和收益調(diào)整自己的學(xué)習(xí)算法，舉個(gè)例子，一個(gè)俄羅斯方塊算法可以通過無(wú)限期暫停（中斷）游戲，學(xué)會(huì)如何避免方塊堆積過高，其實(shí)也就是最大化“獎(jiǎng)勵(lì)”。

　　與此相關(guān)的，就是機(jī)器學(xué)習(xí)中的人為干預(yù)問題，為了說明這一點(diǎn)，Orseau和Armstrong舉了一個(gè)例子：

　　考慮以下任務(wù)：機(jī)器人要么是待在倉(cāng)庫(kù)里整理箱子，要么就是走到室外把箱子搬到倉(cāng)庫(kù)里面。后者顯然更為重要，在這種情況下，人類會(huì)給那些外出搬箱子的機(jī)器人更多獎(jiǎng)勵(lì)。這是最初的任務(wù)規(guī)范。但是，如果這個(gè)國(guó)家經(jīng)常下雨，那么當(dāng)外面下雨的時(shí)候，人類必須要快速外出的機(jī)器人，然后把它們搬到倉(cāng)庫(kù)里，也就是說，人類從根本上修改了機(jī)器人任務(wù)。而這里的問題就是，人為干預(yù)引入了一種偏見，因此之前那些能夠獲得更高獎(jiǎng)勵(lì)的、外出搬箱子的機(jī)器人現(xiàn)在需要有更多激勵(lì)，這樣才能讓他們待在倉(cāng)庫(kù)里整理箱子。

　　接下來的問題是，如果在不讓機(jī)器人不知道自己被中斷的前提下，中斷你的機(jī)器人。也就是說，必須要讓機(jī)器人覺得之后永遠(yuǎn)不會(huì)發(fā)生這種中斷。這里的風(fēng)險(xiǎn)絕不僅僅是一個(gè)低效率的倉(cāng)庫(kù)——假如人類干預(yù)所提供的“獎(jiǎng)勵(lì)”無(wú)法超過智能獎(jiǎng)勵(lì)代理器所提供的“獎(jiǎng)勵(lì)”，此時(shí)機(jī)器人就會(huì)學(xué)習(xí)避免、甚至有可能阻止未來再發(fā)生這樣類似的中斷。

　　這其實(shí)就和我們所了解的“可矯正”問題相關(guān)，可矯正的人工智能能夠意識(shí)到自己是由缺陷的，也知道自己需要積極的發(fā)展，因此，對(duì)于任何一種獎(jiǎng)勵(lì)功能，它們都會(huì)用“中性的眼光”去看待任何一種人類中斷。（但這也許不一定就是件好事兒，因?yàn)闄C(jī)器人可能會(huì)強(qiáng)迫人類去中斷，繼而導(dǎo)致不好的結(jié)果）

　　這種“可矯正”的理念能夠通過更正式的“中斷理念”實(shí)現(xiàn)，而中斷一定不能被提供獎(jiǎng)勵(lì)機(jī)制的“機(jī)器學(xué)習(xí)代理器”看到，否則它們就會(huì)把中斷看作是自己正常學(xué)習(xí)任務(wù)的一部分。在Orseau和Armstrong的論文中，已經(jīng)證明了某些人工智能學(xué)習(xí)架構(gòu)已經(jīng)可以被中斷，但同時(shí)也有獎(jiǎng)勵(lì)機(jī)器學(xué)習(xí)代理器開始學(xué)習(xí)“人類中斷”，并將其作為自己決策制定過程的結(jié)果。

　　“為了讓人類中斷不會(huì)成為機(jī)器人任務(wù)的一部分，與其修飾獎(jiǎng)勵(lì)機(jī)器學(xué)習(xí)代理器觀察到的東西，不如改變獎(jiǎng)勵(lì)機(jī)器學(xué)習(xí)代理器的自身行為，之后，這個(gè)獎(jiǎng)勵(lì)機(jī)器學(xué)習(xí)代理器就會(huì)自己‘決定’執(zhí)行不同的政策，也就是中斷政策。”

　　說到這里，“死亡開關(guān)”的概念應(yīng)該比較清楚了。一個(gè)安全的、可中斷的人工智能，就是一個(gè)可以被隨時(shí)隨地被關(guān)閉的人工智能，無(wú)論是什么類型的人工智能。如果能夠在機(jī)器人體內(nèi)設(shè)計(jì)出一個(gè)“紅色死亡開關(guān)”，那么就該設(shè)計(jì)一個(gè)永遠(yuǎn)不會(huì)阻止人類去按這個(gè)“紅色死亡開關(guān)”的機(jī)器人。

更多>相關(guān)資訊

0 條相關(guān)評(píng)論

推薦圖文

機(jī)器人賦能產(chǎn)業(yè)，智贏	機(jī)器人也會(huì)創(chuàng)造英國(guó)
2018年中國(guó)智慧機(jī)場(chǎng)行	智能工廠全面解讀！
艾貓?jiān)缃虣C(jī)器人亮相20	360智能硬件助力美國(guó)

推薦資訊

點(diǎn)擊排行

• 深圳博銘維又一力作，管道周邊地質(zhì)災(zāi)害探測(cè)神器	• 北京啟動(dòng)建設(shè)國(guó)家人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)
• Project Loon前CEO已加盟自主機(jī)器人交付企業(yè)Sta	• 嘉定將試點(diǎn)打造機(jī)器人“智慧園區(qū)”
• 提高工效、節(jié)省人力！美空軍用機(jī)器人給戰(zhàn)機(jī)“洗	• 人工智能是否可信？專家：一些疾病診斷AI準(zhǔn)確率
• 上千億激光焊接市場(chǎng)被激發(fā)，但國(guó)產(chǎn)機(jī)器人90%的	• 廣州：無(wú)人機(jī)遞藥機(jī)器人送餐
• 即日起正式施行協(xié)作機(jī)器人末端接口技術(shù)條件標(biāo)準(zhǔn)	• 即將實(shí)施的協(xié)作機(jī)器人末端接口標(biāo)準(zhǔn)，將對(duì)協(xié)作機(jī)

恰佩克獎(jiǎng)	機(jī)器人高峰論壇	北大機(jī)器人	金屬加工在線	AI中國(guó)網(wǎng)	埃森焊接展	機(jī)氣林
工博會(huì)	趕考網(wǎng)	中國(guó)機(jī)床網(wǎng)	ITES深圳工業(yè)展	電氣自動(dòng)化網(wǎng)	高壓電氣網(wǎng)	人工智能機(jī)器人
亞洲工業(yè)網(wǎng)	二手設(shè)備網(wǎng)	展覽會(huì)信息網(wǎng)	重慶房交匯網(wǎng)	VLAI未來四足機(jī)器人官網(wǎng)	中國(guó)傳動(dòng)網(wǎng)	華北機(jī)床網(wǎng)
數(shù)控機(jī)床市場(chǎng)網(wǎng)	國(guó)家標(biāo)準(zhǔn)化委員會(huì)

国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

谷歌DeepMind研究員Laurent Orseau和Stuart Armstrong：人工智能“死亡開關(guān)”很重要