田晏林 發自 凹非寺量子位 | 公眾號 QbitAI
人工智能和機器人領域,有一個反直覺現象:
往往人類覺得復雜、困難的任務,機器人做起來很容易;而人類不以為意的一些感知與運動技能,讓機器復現異常困難。
就像AlphaGo可以輕松打敗人類圍棋冠軍,但如果將其置于機器人體內,可能連一只貓都抓不穩;
大模型能破解國際數學奧林匹克競賽難題,卻無法驅動機械手精準地捏起一支筆并寫下答案。
這種人類對任務預期與機器實際處理難度的理解錯位,就是莫拉維克悖論。
因為對世界人形機器人大賽“有點失望”,前Google資深機器人專家Benjie Holson用自己的名字創辦了Benjie’s Olympics,向機器人專家們發出挑戰。
![]()
在這個具身靈巧操作奧林匹克的“賽場”,機器人可以挑戰15項任務,包括抹花生醬、洗油膩的平底鍋、插鑰匙開鎖、把襪子翻過來等人類最日常的動作。
這也是莫拉維克悖論中,機器很難處理的各種典型場景。
有參賽團隊耗費6個月打磨Demo,在任務挑戰中遭遇“滑鐵盧”,3天內失敗率高達90%,盡顯賽事的嚴苛與殘酷。
這15項任務來自5個Event:開門、洗衣、基本工具使用、指尖、濕滑路面。
每個Event下都有3個任務,按照難度的不同,分為金銀銅牌。只有每項任務獲得第一,才能摘得對應的獎牌。
在一輪輪的貼身肉搏中,來自中國的具身智能公司星動紀元,一舉斬獲三項任務全球第一,包括兩項金牌難度任務第一,一項銀牌難度任務第一。
![]()
在剝橘子、開鎖、翻襪子任務中,其表現全面超越美國明星具身智能公司Physical Intelligence(簡稱“PI”),刷新世界紀錄。
要知道,在其他比賽里出現的PI,大多是別人拉著它的開源模型去跑的,并不是PI主動參加。
但Benjie’s Olympics是PI目前唯一一個主動參加的比賽。用的還是閉源模型,代表了PI的最高水平。
星動紀元作為該賽事目前唯一上榜的中國具身企業,也是唯一一個在該比賽中打敗了PI閉源模型的玩家。
終極真實壓力測試
和正規機器人大賽相比,Benjie’s Olympics沒有繁瑣的報名流程、華麗的賽事包裝,只因最純粹的實操能力對決,吸引全球不少頂尖具身智能公司的關注。
Scientific American評價其是物理智能終極真實壓力測試:
“it’s where demos die and useful robots are born.”
(Demo死在這里,實用機器人從這里誕生。)
Benjie’s Olympics的核心特質是強制泛化而非復現。
它不考察機器人對固定場景的機械復刻,只檢驗其在真實復雜環境中的自適應、自決策能力。
換句話說,只有真正具備泛化與觸覺智能的系統,才能在比賽中存活。
在Benjie’s Olympics上,首個拿到多枚金牌的PI團隊曾給出評價:
“Every task targets the hardest unsolved problems in embodiment: deformables, contact-rich manipulation, long-horizon autonomy. No other contest comes close.”
(每個任務都瞄準具身智能最難未解問題:柔性物體、高接觸操作、長時序自主。沒有其他比賽能比肩。)
別看只有15個比賽項目,參賽規則十分嚴苛,要求全自主,開始后無遙控、無人工介入、無遠程修正;
無仿真,必須在真實家庭場景下操作,保證有真實光照、紋理、摩擦、噪聲;
環境隨機、物體也隨便擺放,不可貼標記,也不可預掃描地圖。完全就是閉卷裸考。
唯一讓Benjie Holson拿不準的,是該不該允許“手臂固定在桌子上”的機器人參賽。
他把決定權交給網友,投票結果顯而易見,只允許可移動的機器人參賽。(難度又又又加大了)
![]()
在金銀銅牌的設置上,Benjie’s Olympics有一套自己的規范。
比如洗衣這個Event:“將T恤衫里外翻轉折疊”是銅牌;“把襪子翻過來”是銀牌;掛一件男士襯衫能拿到金牌。
對機器人指尖的考驗:“卷起配對的襪子”是銅牌;“使用狗糞袋撿起便便”是銀牌;“剝橙子”是金牌。
每個任務,Benjie Holson都真人示范一遍。
比賽還規定,只要參賽選手的成績比上一個冠軍的成績至少提高25%,即可獲得獎牌。
看過這15個任務的機器人專家都說,多數隊伍連銅牌都過不了。
![]()
就像剝橙子這個無需任何外部工具即可完成的動作,機器人會非常棘手。
而且,橘子果皮易破、果肉易碎,這個任務難點是要求機器人精準區分果皮與果肉的細微視覺特征,實時跟蹤剝制過程中的果皮形變,要求視覺感知有極高的魯棒性。
![]()
再看開鎖,也是金牌難度任務。
鑰匙孔為毫米級微小目標,要求機器人精準識別鑰匙孔的位置、角度,同時完成鑰匙的姿態理解,實現毫米級對準,還需克服光照變化、金屬反光、視角偏差等多重干擾,無疑是對機器人精細操作與空間感知的雙重挑戰。
這兩項金牌難度任務,星動紀元均打破紀錄,摘得第一。
![]()
剝橙子,之前PI團隊借助削皮刀工具,在2分46秒完成;這次星動紀元純手剝,1分47秒完成,速度提升35%。
他們也成了賽事首個實現完全無工具純手剝操作的團隊。
開鎖,PI團隊66秒完成;星動紀元只用了49秒,速度提升25%。
在銀牌難度任務“翻襪子”中,星動紀元也戰勝了PI。
作為檢驗模型家用泛化能力的核心標桿,翻襪子是柔性物體操作、樣本泛化、效率敏感的典型場景。
襪子翻轉過程中會發生復雜、無規律的形變,要求機器人實時跟蹤形變,精準區分襪子的內外側、開口位置,對視覺感知、柔性物體跟蹤能力要求極高。
PI用了176個樣本,1分33秒完成;星動紀元只用了120個樣本,不僅樣本量減少32%,翻襪子速度也比PI提升了30%。
![]()
Benjie’s Olympics 公布星動紀元銀牌任務(翻襪子)第一
這三項任務,星動紀元均是全球第一,并創下新世界紀錄。
全靠自研VLA具身模型控場
星動紀元能在如此嚴苛賽事中取得成績,靠的不是運氣,自研的VLA具身大模型功不可沒。
該模型具備三個關鍵優勢,沒有一個是虛的,個個都能派上大用場。
第一個優勢,是基礎模型知識遷移能力,也就是讓機器人學東西不費勁。
傳統具身智能模型依賴海量訓練數據,泛化能力受限。
這就好比教一個小孩認蘋果,你得給他看一萬張蘋果的照片他才能記住。換一種光線、換一種顏色的蘋果,他可能又不認得了。
而星動紀元依托強大的知識遷移能力,大幅優化數據利用率。
他們先教會小孩“什么是水果”這個概念,再讓他去認蘋果、橘子、香蕉,這樣就快多了。
單說翻襪子這個任務,星動紀元只用了120組訓練樣本,就比另一支團隊用176組樣本做得還要好。
這意味著機器人能很快適應新場景,研發成本和耗費時間都大大降低。
![]()
第二個優勢,是讓機器人看得更清楚,尤其是那些小東西。
一個會移動的機器人,它的“眼睛”(攝像頭)是跟著身體一起動的。靠近目標的時候,角度在變、距離在變,傳統的方法很容易“看花眼”。
星動紀元的模型引入了自適應視覺注意力機制。
名字很長,但原理很簡單:自動盯著鑰匙、鎖孔、果皮這類細小又關鍵的東西看,自動把它們看得更清楚、特征更突出,就算環境很亂、機器人底盤輕微晃動,也能精準識別。
![]()
第三個優勢,是讓機器人反應變快,手還很穩。
傳統模型的工作方式是“做完一步,再看下一步”,模型單次生成超1秒的運動軌跡,響應慢、誤差易累積。
比如,翻襪子過程中襪子突然變形了,等機器人想完下一步怎么做,襪子已經滑到別處去了。
星動紀元采用異步高頻推理與短時域規劃策略,可在當前軌跡未完成時,同步預測下一段運動軌跡,生成后立即切換執行。
![]()
如圖所示,機器人的一個關節沿著Chunk 1的路徑運動,直到Chunk 2出現的垂直線,然后你開始沿著該路徑運動,直到Chunk 3出現,依此類推。
這樣一來,每條路徑的最后一段其實用不上,因為新的路徑總會提前出現,機器人直接切換過去就行。
簡單來說,機器人在做當前動作的同時,大腦已經在預判下一步、下下一步該怎么走了。
一旦新的路徑算出來,機器人立刻切換過去,中間不等待。每條規劃的路其實最后一段都用不上,因為新的路總會提前出現。規劃得越頻繁,機器人就越靈敏。
所以在翻襪子這種襪子不斷變形的任務里,星動紀元的機器人能快速調整動作,重新找到襪口,一氣呵成。
這三項改進加在一起,效果就更明顯了。
星動紀元的機器人不僅眼看得清,手指靈活,還可以理解工具怎么用,雙手協同干活,甚至能完成多步驟、需要長時間規劃的任務。
正是這套全自研的VLA具身模型,讓星動紀元在“只允許移動機器人參賽”這條硬規則下,不僅沒有吃虧,反而把移動帶來的動態不確定性,變成了自己的護城河。
冠軍團隊,不止于賽事
這不是星動紀元第一次屠榜了。
2025年10月,星動紀元創始人陳建宇與斯坦福大學Chelsea Finn(PI聯合創始人)團隊研發了Ctrl-World可控生成世界模型。
該模型在全球具身智能頂級世界模型權威評測WorldArena榜單中,超越谷歌、英偉達,斬獲具身任務全球第一。
2026年2月,雙方再次聯合提出VLAW框架,首次實現VLA策略與動作條件世界模型的協同迭代優化。星動紀元也成了唯一和PI兩次合作的中國具身公司。
陳建宇對端到端VLA范式有多堅持呢?
![]()
2020年從加州大學伯克利博士畢業后,陳建宇回到母校清華大學,擔任交叉信息研究院助理教授,28歲成為清華博導,2023年創辦星動紀元。
2024年9月,星動紀元成為全球首個提出分頻VLA的團隊,PI、Figure、Google、NVIDIA都得排在它后面。
同年12月,該公司發布融合世界模型的VLA算法框架Video Prediction Policy(現已開源)。
2025年,星動紀元自研的ERA-42端到端VLA具身大模型,實現了對全尺寸雙足人形機器人全身及五指靈巧手的精準控制,成為全球僅有的四家能做到這一點的公司之一。
技術的終極價值,在于實用。
賽場之外,星動紀元的VLA具身大模型已在多個領域落地。
物流方面,其與順豐合作;在制造業方面,與吉利、北汽合作;在商業服務、家庭服務領域,已與海爾、聯想、世紀金源等企業達成合作。
![]()
在今年中關村論壇亮相的智能分揀機器人,就是星動紀元真干活機器人的代表。
日常工作中,它不僅能完成藥品、日化品、包裹的分揀及掃碼,還能完成“零部件抓取-高精度裝配-質量檢測”等制造業場景的任務。
在商業服務領域,星動紀元的機器人負責門店客座清潔、物品遞送、導游導覽等工作。其中,部分場景效率當前達到70%~80%。
星動紀元做的事倒是很符合Benjie’s Olympics賽事的初衷:讓有用的機器人在這里誕生,讓只活在Demo里的技術永遠死去。
當越來越多的玩家從炫技轉向實用,會發現在機器人這場長跑里,真正的對手從來不是別人,而是那個人類習以為常、機器卻步履蹣跚的物理世界。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.