自變量機(jī)器人于近日完成近10億元A+輪融資。本輪由阿里云、國科投資領(lǐng)投,國開金融、紅杉中國、渶策資本跟投。老股東美團(tuán)戰(zhàn)投超額跟投,聯(lián)想之星、君聯(lián)資本持續(xù)追投。
此次為阿里云首次出手具身智能公司,阿里云對自變量技術(shù)高度認(rèn)可,將為自變量提供多維度支持。資金將用于自變量全自研通用具身智能基礎(chǔ)模型的持續(xù)訓(xùn)練和硬件產(chǎn)品的研發(fā)迭代。
從2023年底成立起,自變量就確立了以端到端統(tǒng)一大模型實(shí)現(xiàn)通用具身智能的終極技術(shù)路徑 ,并于近期發(fā)布了適配多模態(tài)大模型控制的全自研輪式雙臂仿人形機(jī)器人——量子2號(hào)(Quanta X2)。自變量軟硬一體同步發(fā)展的技術(shù)路線,及前瞻性的技術(shù)理念和成果也受到國家級(jí)投資平臺(tái)、國內(nèi)外頂級(jí)投資機(jī)構(gòu)與產(chǎn)業(yè)資本的認(rèn)可。
作為國內(nèi)最早實(shí)現(xiàn)端到端具身智能大模型的公司,自變量自主研發(fā)「WALL-A」系列VLA(Vision-Language-Action )操作大模型,構(gòu)建統(tǒng)一的認(rèn)知與行動(dòng)框架。在統(tǒng)一表示空間中,模型同時(shí)處理感知、推理和行動(dòng),直接進(jìn)行跨模態(tài)的因果推理和行動(dòng)決策,讓機(jī)器人最終能夠像人類一樣思考和工作。當(dāng)前,「WALL-A」模型已在部分完全未訓(xùn)練過的新任務(wù)類型中展現(xiàn)出零樣本泛化能力。
同時(shí),公司率先實(shí)現(xiàn)端到端具身思維鏈推理框架,基于多模態(tài)輸入進(jìn)行深度推理并生成多模態(tài)輸出,形成模型自主決策、執(zhí)行、探索和反思的完整閉環(huán)。模型能夠?qū)⒄Z言理解、視覺感知與動(dòng)作執(zhí)行緊密結(jié)合,形成更接近人類思維的推理過程,成功突破多步驟長序列任務(wù)瓶頸,任務(wù)完成度大幅提升,極大擴(kuò)展了機(jī)器人處理復(fù)雜現(xiàn)實(shí)場景的能力邊界。
今年年中,公司首個(gè)實(shí)現(xiàn)具身智能大模型控制高自由度靈巧手進(jìn)行復(fù)雜操作。此前,自變量發(fā)布了自研大模型控制高自由度靈巧手精巧拿取并分發(fā)撲克牌這類彈性易形變物體的視頻。
當(dāng)前,為推動(dòng)具身智能大模型的研究與應(yīng)用,自變量開源其面向開發(fā)者的具身基礎(chǔ)模型:「Wall-OSS」,并公開相關(guān)訓(xùn)練代碼,便于全球開發(fā)者們在自有本體上快速微調(diào)和實(shí)際應(yīng)用。
Wall-OSS 具備強(qiáng)大的泛化性和推理能力,在長程操作任務(wù)方面表現(xiàn)優(yōu)于其他基礎(chǔ)模型,同時(shí)作為多模態(tài)基座,模型也具備良好的因果推理、空間理解和反思能力等。
Wall-OSS是一個(gè)基于大規(guī)模真實(shí)數(shù)據(jù)訓(xùn)練的開源具身基礎(chǔ)模型。在模型架構(gòu)上,創(chuàng)新性設(shè)計(jì)“共享注意力 + 專家分流 (FFN)”架構(gòu),VLM預(yù)訓(xùn)練知識(shí)無損遷移到操作模型,語言、視覺、動(dòng)作等信息都嵌入在同一個(gè)表示空間中處理;在訓(xùn)練方式上,首創(chuàng)“先離散、后連續(xù)、再聯(lián)合”的三階段訓(xùn)練范式,首創(chuàng)“先離散、后連續(xù)、再聯(lián)合”的多階段訓(xùn)練范式,保留了VLM 的語言與視覺理解能力,又具備細(xì)粒度動(dòng)作執(zhí)行力;此外,統(tǒng)一跨層級(jí)思維鏈實(shí)現(xiàn)了跨層級(jí)抽象層面的前向任意映射,模型能夠在單一可微分框架內(nèi)無縫切換高層決策與底層執(zhí)行。
硬件方面,今年8月,自變量發(fā)布了全自研輪式雙臂仿人形機(jī)器人“量子2號(hào)(Quanta X2)。在過去不到半年時(shí)間內(nèi),公司實(shí)現(xiàn)了機(jī)器人本體整機(jī)、高自由度靈巧手、外骨骼遙操數(shù)采設(shè)備等全棧自研。
量子2號(hào)是模型原生的通用機(jī)器人本體,在設(shè)計(jì)上不僅考慮了模型訓(xùn)練及復(fù)雜操作任務(wù)的需求,更在負(fù)載能力、操作空間、運(yùn)動(dòng)速度及控制精度等核心指標(biāo)上,實(shí)現(xiàn)了全面的平衡與優(yōu)化。
量子2號(hào)的五指靈巧手采用仿生結(jié)構(gòu)設(shè)計(jì),單手擁有 20 個(gè)自由度,并能感知細(xì)微的壓力變化。同時(shí),基于臂手一體化外骨骼技術(shù),自變量首創(chuàng)行業(yè)領(lǐng)先的“仿人機(jī)械臂+高自由度靈巧手”一體化全身遙操方案,量子2號(hào)不僅能采集高質(zhì)量數(shù)據(jù)反哺模型訓(xùn)練,也將與自研模型深度融合,真正進(jìn)入到現(xiàn)實(shí)場景中落地應(yīng)用。
隨著軟硬一體綜合能力的提升,目前自變量的機(jī)器人,已與頭部服務(wù)業(yè)、工業(yè)客戶達(dá)成合作,在多場景中投入使用。未來自變量也將與客戶圍繞模型和硬件共建開放生態(tài),推動(dòng)具身智能的進(jìn)一步發(fā)展。