近日,機器人與自動化領(lǐng)域全球頂會ICRA 2025在美國亞特蘭大開幕。由中國科學院自動化研究所與靈寶CASBOT共同提出的關(guān)于“增強物理人機協(xié)作中的人類意圖估計和人機角色分配”方法(DTRT: Enhancing Human Intent Estimation and Role Allocation for Physical Human-Robot Collaboration)獲ICRA 2025錄用。
01. DTRT:增強物理人機協(xié)作中的人類意圖估計和人機角色分配
在物理人機協(xié)作(physical Human-Robot Collaboration, pHRC)中,準確的人類意圖估計和合理的人機角色分配對安全高效的協(xié)作至關(guān)重要?,F(xiàn)有的依賴短期運動數(shù)據(jù)進行意圖估計的方法缺乏多步預測能力,阻礙了機器人感知長期意圖變化和自主調(diào)整人機分配的能力,從而導致潛在的人機分歧。為了解決這些問題,中國科學院自動化研究所與靈寶CASBOT共同提出了一種基于對偶Transformer的人機協(xié)作框架(Dual Transformer-based Robot Trajectron, DTRT),該框架采用分層結(jié)構(gòu),利用人類引導的運動和力數(shù)據(jù)來快速捕獲人類意圖變化,從而實現(xiàn)準確的軌跡預測和動態(tài)機器人行為調(diào)整,最終實現(xiàn)有效的物理人機協(xié)作。
基于雙變壓器的機器人軌跡器,用于人類意圖估計和角色分配
具體而言,DTRT中的人類意圖估計利用兩個基于Transformer的條件變分自編碼器(Conditional Variational Autoencoder, CVAE),將機器人在無障礙物情況下的運動數(shù)據(jù)與避障時人類引導的軌跡和力相結(jié)合。此外,我們采用基于人類施加力的微分合作博弈論(Differential Cooperative Game Theory, DCGT)來綜合兩種預測,確保機器人的行為與人類的意圖一致。與現(xiàn)有方法相比,DTRT將人類動態(tài)納入長期預測,提供準確的意圖理解,實現(xiàn)合理的角色分配,提升機器人的自主性和可操作性。
02. 物理人機協(xié)作面臨意圖預測與角色分配的雙重挑戰(zhàn)
物理人機協(xié)作(pHRC)在制造、醫(yī)療保健和服務(wù)中至關(guān)重要。需要有效的策略來確保機器人能夠無縫地與人類協(xié)作,進行準確的估計意圖,并動態(tài)調(diào)整行為,從而協(xié)助人類。因此,精確的人類意圖估計和合理的人機角色分配是提高pHRC性能的關(guān)鍵挑戰(zhàn)。
基于人類意圖對未來軌跡的準確預測對于機器人輔助的有效性和pHRC的安全性至關(guān)重要。在存在潛在危險的復雜環(huán)境中,例如當機器人遇到未知障礙物時,人類意圖的快速變化給意圖估計帶來了重大挑戰(zhàn)。目前的方法主要依賴于短期運動數(shù)據(jù),如位置和速度,這限制了檢測人類意圖變化,將影響預測的準確性和安全性。
此外,短期數(shù)據(jù)會降低長期協(xié)作中意圖估計的有效性。因此,研究將人類施加的力量整合到pHRC中的長期預測方法對于實現(xiàn)準確的意圖估計至關(guān)重要。此外,人機角色分配涉及一種復雜的機制,用于在人類和機器人之間分配任務(wù)控制權(quán)。這一過程將實時協(xié)調(diào)人機關(guān)系,減少分歧并提高機器人的輔助水平。現(xiàn)有方法主要依賴阻抗/柔順性控制,通過修改模型參數(shù)來確定角色。在各種方法中,基于博弈論的角色分配模擬多參與者之間的協(xié)作過程,將目標設(shè)定為最小化成本函數(shù)以實現(xiàn)最優(yōu)的人機協(xié)同關(guān)系。然而,確保機器人行為與人類意圖一致,同時保持自主性和靈活性仍然是一個重大挑戰(zhàn)。
03. DTRT在預測精度與協(xié)作表現(xiàn)方面展現(xiàn)顯著優(yōu)勢
實驗結(jié)果表明, DTRT在預測精度方面具有顯著優(yōu)勢,在多個物理人機協(xié)作指標上表現(xiàn)出卓越的性能,有效降低了人機分歧并提高了機器人的輔助水平,具有巨大的應用潛力。DTRT的核心優(yōu)勢在于以下三點:
1. DTRT將人類意圖估計與人機角色分配相結(jié)合,以檢測意圖變化并減少人機分歧,有效提高了復雜和危險易發(fā)環(huán)境中的人機協(xié)作性能。
2. DTRT中的基于分層結(jié)構(gòu)的人類意圖估計同時處理人機協(xié)作中的運動和力數(shù)據(jù),提高了人類意圖的預測精度,提供了對意圖的準確理解。
3. 基于微分合作博弈論的人機角色分配實現(xiàn)了基于人施加的力的自適應領(lǐng)導者切換,確保機器人的行為與人類意圖一致,在保持機器人自主性的同時減少分歧。
在物理人機協(xié)作性能上,使用了以下指標:
在實驗中,我們對障礙物進行替換和隨機定位。結(jié)果表明,DTRT在物理人機協(xié)作場景下優(yōu)于現(xiàn)有方法。DTRT的平均人機協(xié)作角度為76.4°,平均機器人輔助水平指數(shù)為1.5,人機系統(tǒng)在61.8%的時間內(nèi)處于協(xié)作狀態(tài)。此外,人機角色分配有效地平衡了機器人的自主性和人類引導,使得僅有3.5 J的人類機械功??傮w而言,DTRT準確估計了人類意圖變化,合理分配了領(lǐng)導者和追隨者的角色,從而減少了人機分歧,提高了機器人的輔助水平,促進了安全高效的物理人機協(xié)作。
DTRT與現(xiàn)有方法在指標上的定量對比
DTRT的提出,不只是一個算法突破,更是一次“人機關(guān)系”重構(gòu)的嘗試:它為人形機器人發(fā)展提供了一條兼具通用性與工程價值的技術(shù)路徑。未來,DTRT的研究思路及其核心機制有望在靈寶CASBOT所聚焦的工業(yè)制造、復雜作業(yè)、服務(wù)協(xié)同等多個實際應用場景中持續(xù)拓展與深化。