自從在春晚上,機器人展示了各種吹拉彈唱技能之后,很難讓人不做進一步想象:搞快點,傳說中的家務機器人能不能再搞快點。
就是這個三月,人形機器人公司 Figure 發布了一段新視頻,沒有跳舞,沒有翻跟頭,就是展示家務技能。
![]()
一臺 Figure 03 機器人走進一間散亂的客廳,環顧四周一圈,然后開始干活:把地上的玩具撿起來丟進收納箱,拿起噴霧劑噴在茶幾上再用毛巾擦干凈,把沙發上的抱枕拍松扔回原位,甚至拿起遙控器按下關機鍵把電視關掉。全程沒有任何人類指令,沒有遙控操作,一鏡到底。
這段視頻在社交媒體上迅速傳播,比起各種「酷炫」的機器人 demo,它做的事情很平凡——都是你每天回家后不想做、但又不得不做的事。
這正是 Figure 想要傳達的信號。
不是新硬件,是新「大腦」
特別的是,Figure 并不是發布一臺新機器人,硬件仍然是去年 10 月發布的 Figure 03。這次帶來升級變化的,是一套全新的 AI 控制系統 Helix。
Helix 02 的核心突破在于一個概念:全身自主性(full-body autonomy)。此前的人形機器人,包括 Figure 自己的上一代系統 Helix,大多只能控制上半身,能站在原地伸手抓東西已經算不錯了。走動的時候,系統需要先停下手上的動作、穩定身體、邁步、再停下來、再伸手。
![]()
這種「走-停-做-停-走」的模式意味著機器人但凡做點什么,可能需要花上你自己做的十倍時間,完全本末倒置。
Helix 02 把這個過程徹底打通了。它用一個單一的神經網絡同時控制行走、平衡和操作,機器人可以一邊走路一邊端著碗,可以在手上拿著東西的時候用胯關門,甚至可以在雙手被占用時用腳把洗碗機的門踢開。
這聽起來像是人做家務時最自然不過的動作,但對機器人來說,這是一個困擾了學術界和工業界數十年的難題,loco-manipulation,即移動與操作的統一控制。
連馬斯克都不禁要來問:真是自主嗎?
![]()
為家庭而生的硬件
Helix 02 的架構分為三層,可以類比人類的思考方式:
System 2(慢思考)負責語義理解:看一眼客廳,判斷哪些東西是亂的、應該放哪兒去、先做什么后做什么。這一層處理的是「理解」和「規劃」。
System 1(快思考)負責把理解轉化為動作:以每秒 200 次的頻率將視覺、觸覺、本體感知等所有傳感器的數據轉化成全身關節的目標位置。這一層處理的是「決策」。
System 0(本能層)是這次最大的新增。它以每秒 1000 次的頻率運行,負責平衡、接觸和全身協調。Figure 用超過1000 小時的人類運動數據和模擬環境中的強化學習訓練出了這個底層控制器。用 Figure 的話說,這個 10M 參數的神經網絡替代了原來 109,504 行手寫 C++代碼。
這個三層結構的結果就是:機器人看起來不再像一個在執行預編程指令的機器,而更像一個正在「做家務」的人——動作連貫、有節奏、偶爾還會做出一些看起來很「聰明」的臨時決策(比如把杯子挪開檢查污漬)。
![]()
Helix 02 之所以能做到這些,也離不開 Figure 03 這個硬件平臺的配合。這臺機器人身高 5 英尺 8 英寸(約 168 厘米),體重 61 公斤,一次充電可以工作 5 小時。相比上一代的 Figure 02,它有幾個關鍵變化:
手掌攝像頭和觸覺傳感器。每只手的掌心都內嵌了一個廣角攝像頭,在主攝像頭被遮擋時(比如伸手進柜子里摸東西)提供近距離視覺反饋。每個指尖都有觸覺傳感器,靈敏到可以感知 3 克的力。這使得機器人能從一堆散亂的小物件中精準地拾取單個目標,甚至能用注射器精確推出 5 毫升液體。
全身覆蓋軟性材料。不再是冷冰冰的金屬外殼,而是可拆卸、可清洗的軟面料,戰略性地放置了多密度泡沫來防止夾傷。
無線充電。腳底內嵌感應線圈,站上充電底座即可以 2 千瓦功率充電。不需要人去插線,機器人可以自己走去充電。
![]()
這些細節指向一個明確的產品定位:Figure 03 不是一臺實驗室樣機,而是一臺為了進入家庭而設計的消費品。
年初底發布時,Figure 把演示場景選在了廚房,機器人自主完成了一個長達 4 分鐘的完整任務。
![]()
走到洗碗機前、打開門、取出碗碟、走到櫥柜前放好、再走回來裝載臟碗碟、關門啟動。全程 61 個連續動作,無中斷。Figure 稱這是「人形機器人迄今為止完成的最長時間、最復雜的自主任務」。
3 月這次的演示,則把難度往上推了一層,來到了客廳。廚房雖然復雜,但物品擺放相對固定、動作路徑相對可預測。客廳則是一個每天都在變的空間。
![]()
玩具散落的位置不同,沙發墊的狀態不同,茶幾上的杯子數量不同。軟性物品(毛巾、抱枕)的物理行為難以預測。家具之間的通道狹窄,需要側身通過。很多動作需要雙手配合,另一些則需要在任務進行中臨時騰出一只手。
而且這次演示還加入了工具使用——噴霧瓶 + 擦拭、遙控器按鍵——這要求機器人不僅理解物品「是什么」,還要理解物品「怎么用」。
Figure 強調了一個關鍵點:從廚房到客廳,Helix 02 沒有更換任何算法,也沒有做任何專項工程優化,僅僅是增加了訓練數據。同一套通用架構,喂更多數據就能學會新技能。
![]()
這暗示了一個令人興奮的擴展邏輯:如果收拾客廳只需要「多看幾遍示范」,那收拾臥室、整理衣柜、澆花、喂貓呢?大有可為啊。
「家用機器人時代」真的來了嗎?
先潑一盆冷水。
目前 Figure 03 的估計售價在 5 萬到 10 萬美元之間。即便 Figure 提出了訂閱制(robot-as-a-service)的商業模式,每臺機器人年均產生約 5000 美元收入,這個價格也遠非普通家庭可以承受。而且,演示視頻和真實家庭環境之間還是存在差距。
另外,視頻中的客廳雖然看起來很「日常」,但它仍然是一個受控場景。真實家庭有寵物、有小孩、有堆滿快遞盒的角落、有你三周沒洗的衣服堆。
![]()
但換一個角度看,Helix 02 的意義不在于它今天就能上崗,而在于它證明了一個路徑的可行性:用單一通用 AI 架構 + 更多數據 = 更多家務技能。
這和大語言模型的 scaling law 有異曲同工之處,ChatGPT 不是被專門編程來寫詩或寫代碼的——它只是在更多文本上訓練,就涌現出了這些能力。
Helix 02 展示的是同樣的邏輯在物理世界的映射:一個神經網絡,不需要為每個新任務重新工程,只需要更多的運動數據。
![]()
如果這個邏輯成立,那么人形機器人的進化速度將不再取決于工程師寫了多少行代碼,而取決于它「看過」多少種家務場景。而家務場景的數據采集,恰恰是最容易規模化的——畢竟,每個人的家里每天都在產生這些數據。
Figure 目前的制造工廠 BotQ 已經具備年產萬臺的能力,目標是四年內累計生產 十萬臺。每一臺出貨的機器人都是一個數據采集終端,它們在不同家庭中遇到的每一個新場景,都會通過 10Gbps 毫米波無線回傳變成下一版 Helix 的訓練素材。
用 Brett Adcock 的話說,制約他們出貨的不是需求,恰恰是 AI 還不夠通用。而 Helix 02 的客廳演示,讓「夠通用」這個目標又近了一步。
從跳舞到收拾客廳, Helix 02 邁出的這一步,可能比任何后空翻都更接近未來。機器人不再需要證明自己有多酷,它需要證明自己有多有用。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.