近日,谷歌發(fā)布新的機器人模型RoboticsTransformer2(RT-2),搭載了大語言模型的最新進(jìn)展,且能幫助訓(xùn)練機器人理解扔垃圾等任務(wù)。
RT-2是一種“視覺-語言-行動”模型,可以通過在網(wǎng)絡(luò)上投喂信息和圖像,訓(xùn)練機器人執(zhí)行響應(yīng)的動作。這使得機器人變得更加聰明,并賦予它們新的理解和解決問題的能力。
例如,如果希望以前的系統(tǒng)能夠扔掉垃圾,必須明確地訓(xùn)練它們能夠識別垃圾,以及撿起并扔掉垃圾。RT-2則能夠從大量的網(wǎng)絡(luò)數(shù)據(jù)中轉(zhuǎn)移知識,它已經(jīng)知道什么是垃圾,并且可以在沒有明確訓(xùn)練的情況下識別垃圾。
谷歌宣稱,相比以往第一個版本,新的模型讓機器人的性能幾乎翻倍,準(zhǔn)確率從32%提升至62%。
