熱搜： 佳士科技 irobot 工業(yè)機器人機器人 ABB 機器人產(chǎn)業(yè)聯(lián)盟發(fā)那科庫卡碼垛機器人機械手

深度學習能力人工智能教機器人走路！

日期：2019-01-02 來源：手機中國作者：阿芬評論：0

標簽：

　　人工智能系統(tǒng)，使機器人具備了像人類一樣靈巧地掌握和操縱物體的能力，現(xiàn)在，研究人員表示，他們已經(jīng)開發(fā)出一種算法，通過這種算法，機器可能學會獨立行走。來自加州大學伯克利分校和其中之一的谷歌人工智能研究部門的科學家們，在Arxiv.org上發(fā)表《通過深度強化學習，來學習走路》，它描述一個人工智能系統(tǒng),教一個長了四只腳的機器人穿越熟悉和不熟悉地形。

　　該論文作者解釋說，深度強化學習可以用于自動獲取一系列機器人任務數(shù)據(jù)，從而實現(xiàn)將感知輸入映射到低級動作的策略的端到端學習。如果我們能在現(xiàn)實世界中，直接從零開始學習移動步態(tài)，原則上，我們就能獲得最適合于每個機器人的步態(tài)，從而有可能獲得更好的靈活性、能源效率和穩(wěn)健性。

　　設計挑戰(zhàn)有兩方面。強化學習人工智能訓練技術使用獎勵或懲罰來驅動個體朝著目標前進，需要大量的數(shù)據(jù)，在某些情況下需要數(shù)萬個樣本，才能取得良好的結果。即：在美國，決定其結構的參數(shù)通常需要進行多次訓練，這可能會隨著時間的推移損害機器人。

　　作者指出，深度強化學習在仿真中廣泛應用于學習運動策略，甚至將其應用到現(xiàn)實機器人中，但由于仿真中存在的差異，不可避免地會導致一些性能損失，需要大量的手工建模。事實證明，在現(xiàn)實世界中使用這種算法是具有挑戰(zhàn)性的。

　　為了尋求一種方法，用研究人員的話說，可以讓一個系統(tǒng)在沒有模擬訓練的情況下學習運動技能，他們開發(fā)了一個名為 maximum entropy RL的強化學習框架。它優(yōu)化了學習策略，即被處理數(shù)據(jù)的隨機性最大化。在RL中，AI agent通過對策略中的行為進行采樣并獲得獎勵，不斷尋找行為的最優(yōu)路徑，即狀態(tài)和行為的軌跡。

　　他們開發(fā)了一個由計算機工作站組成的流水線，該工作站更新神經(jīng)網(wǎng)絡，從Minitaur下載數(shù)據(jù)，并上傳最新的策略，機器人上搭載的Nvidia Jetson TX2執(zhí)行上述策略，收集數(shù)據(jù)，并通過以太網(wǎng)將數(shù)據(jù)上傳到工作站。兩小時內(nèi)，他們用一種獎勵前進速度、懲罰大角度加速度和俯仰角的算法，走了16萬步，成功地訓練了這架小型機器人在平坦的地形上行走，越過木塊等障礙物，爬上斜坡和臺階。

　　研究人員寫道，據(jù)我們所知，這個實驗是一個深層強化學習算法的第一個例子，該算法直接在現(xiàn)實世界中學習不受驅動的四足動物運動，不需要任何模擬或預先訓練。

更多>相關資訊

0 條相關評論

推薦圖文

機器人賦能產(chǎn)業(yè)，智贏	機器人也會創(chuàng)造英國
2018年中國智慧機場行	智能工廠全面解讀！
艾貓早教機器人亮相20	360智能硬件助力美國

推薦資訊

點擊排行

• 機器人產(chǎn)業(yè)將迎來“中國時代” 有什么利弊？	• 哈工大（深圳）Critical-HIT機器人隊奪冠2021年
• 2021廈門工博會“黑科技”：可“上天”可“下地	• 微創(chuàng)醫(yī)療擬分拆微創(chuàng)醫(yī)療機器人赴港上市
• 工業(yè)自動化浪潮加速國產(chǎn)機器人崛起	• 首個雙屏智能翻譯器！訊飛雙屏翻譯機開啟雙屏翻
• 深圳博銘維又一力作，管道周邊地質災害探測神器	• 北京啟動建設國家人工智能創(chuàng)新應用先導區(qū)
• Project Loon前CEO已加盟自主機器人交付企業(yè)Sta	• 嘉定將試點打造機器人“智慧園區(qū)”

恰佩克獎	機器人高峰論壇	北大機器人	金屬加工在線	AI中國網(wǎng)	埃森焊接展	機氣林
工博會	趕考網(wǎng)	中國機床網(wǎng)	ITES深圳工業(yè)展	電氣自動化網(wǎng)	高壓電氣網(wǎng)	人工智能機器人
亞洲工業(yè)網(wǎng)	二手設備網(wǎng)	展覽會信息網(wǎng)	重慶房交匯網(wǎng)	VLAI未來四足機器人官網(wǎng)	中國傳動網(wǎng)	華北機床網(wǎng)
數(shù)控機床市場網(wǎng)	國家標準化委員會

国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

深度學習能力 人工智能教機器人走路！

深度學習能力人工智能教機器人走路！