科技媒體 AppleInsider 5 月 21 日 發(fā)布博文,報道稱蘋果公司最新披露 PH2D 方法,結合人類教練和機器人示范者訓練人形機器人,讓其獲得更高效的學習效果。
蘋果公司于本周三發(fā)布《Humanoid Policy ~ Human Policy》研究論文,直指傳統(tǒng)訓練方法的不足,提出了一種可擴展且成本效益高的新方案,稱為“PH2D”(Physical Human-Humanoid Data)。
蘋果公司在專利中指出,傳統(tǒng)人形機器人訓練依賴機器人示范者,過程被描述為“勞動密集型”,且需要昂貴的遠程操作數(shù)據(jù)采集。
IT之家援引博文介紹,蘋果的新方法結合人類教練和機器人示范者,利用改造后的消費級設備,制作訓練素材。
例如,Apple Vision Pro 頭顯被調整為僅使用左下角攝像頭進行視覺觀察,配合 ARKit 技術獲取 3D 頭部和手部姿態(tài)數(shù)據(jù);改造后的 meta Quest 頭顯搭載 mini ZED 立體攝像頭,成為低成本訓練工具。
人類教練通過這些設備記錄手部操作,包括抓取、抬起物體和倒液體等動作,錄制過程中還提供語音指導,視頻被放慢后用于機器人訓練。
蘋果為此還開發(fā)了名為“Human-humanoid Action Transformer”(HAT)的模型,能夠同時處理人類教練和機器人示范者生成的數(shù)據(jù)。
這一模型構建了一個通用的策略框架,相較于僅使用真實機器人數(shù)據(jù)的訓練方式,表現(xiàn)出更好的泛化能力和穩(wěn)健性。研究顯示,這種結合訓練策略在特定任務(如垂直抓取物體)中,效果優(yōu)于單一機器人示范者訓練。
蘋果的研究表明,這種結合訓練方式不僅成本效益高,還能顯著提升機器人表現(xiàn)。盡管目前僅展示了機器人燈原型,但據(jù)傳蘋果正在研發(fā)面向終端消費者的移動機器人,可執(zhí)行家務和簡單任務。