![]()
熱熱鬧鬧了一整年,機器人在真實場景中干活的水平怎么樣了?
昨天,具身智能領域傳來的一則消息,或許能為我們帶來一個更為清晰的信號。
1月12日,千尋智能宣布開源自研的VLA(視覺-語言-動作)基礎模型Spirit v1.5。就在前一天,該模型在全球具身智能模型評測平臺RoboChallenge的綜合評測中一舉登頂,超越美國具身智能明星公司Physical Intelligence的Pi0.5。
![]()
在過去的2025年里,千尋智能旗下人形機器人Moz1頻繁活躍在北上廣深杭的各大展會上,疊衣服、串奶皮子糖葫蘆、搭積木、賣飲料、端盤子……而就在上個月下旬,它們的小伙伴“小墨”,正式成為寧德時代中州基地的“員工”,在生產線上開展實際工作。
![]()
![]()
全球榜單中
唯一成功率破50%的模型
Spirit v1.5是什么?
Spirit v1.5是千尋智能自主研發并開源的VLA基礎模型,將視覺感知、語言理解與動作生成整合在同一決策流程中,減少多模塊串聯帶來的信息損耗,并提升長程任務中的整體穩定性。
RoboChallenge又是什么?
它是一個面向真實機器人執行場景的標準化評測基準,由Dexmal(原力靈機)、Hugging Face(抱抱臉)等全球知名機構聯合發起,聚焦具身智能模型的跨平臺能力驗證。
這個平臺強調真實機器人執行能力,評測維度涵蓋復雜指令理解、多步驟操作、跨場景穩定性等,被業界視為當前具身智能領域最接近真實落地場景的基準測試之一。
具體測些什么?
本次測試包括30項操作任務(Table 30),像是插花、掛牙刷杯、尋找指定顏色的物體、貼膠條、將筆放入筆盒等。
在這些操作任務的測試中,Spirit v1.5綜合得分為66.09分,成功率達到50.33%,是唯一一個成功率超過50%的模型。
![]()
此前數月,在這份榜單上霸榜的是Pi0.5模型。它由Physical Intelligence于2025年4月發布,曾因能讓機器人在全新環境中完成復雜家務而引發網友熱議。
此次登頂,也意味著國產具身智能企業,正式躋身全球核心第一梯隊。
為了證實榜單成績源于自研模型且真實可信,千尋智能已同步開源Spirit v1.5的基模權重、推理代碼和使用樣例,并表示接受公眾與研究社區的獨立檢驗。
![]()
成功率100%的是疊碗
從榜單能不能看出機器人現在能做些什么?
先來看一些具體任務中的對比表現:
插花任務:Pi05夾起一枝花,但沒能插進花瓶,而是橫放在了瓶口;Spirit v1.5通過靈活調整關節,保證花枝豎直,并被插入花瓶中。
Pi05
Spirit v1.5
清理碗碟:Spirit v1.5可以準確夾起碗放入透明收納箱,同時將廢紙巾扔進前方綠桶;Pi0.5雖也能完成放碗動作,但偶爾會出現“機械式執行”——無法判斷是否已抓取物品,僅按固定步驟操作。
Pi05
Spirit v1.5
尋找綠盒:Spirit v1.5能從彩色方塊中鎖定綠色目標,準確夾取(該項任務成功率高達90%,在所有參與測試的模型中位列第一);Pi05錯選了其中一個黃色方塊。
Pi05
Spirit v1.5
貼膠帶:Spirit v1.5可協調雙臂撕下一段膠帶,貼于快遞盒上;Pi0.5則未能成功撕下膠帶,僅做出一個貼附的“假動作”。貼膠帶屬于典型的閉環觸覺接觸任務,對機械臂協同與觸覺感知要求極高,常會出現“空抓”現象。
Pi0.5
Spirit v1.5
根據RoboChallenge官網公布的成績,在“疊碗”(將三只小碗疊放)任務中,Spirit v1.5獲得98分,成功率100%;將鋼筆放入筆盒、鞋子擺上架子、杯子放置杯墊等任務,成功率也都達到了90%。
為何要參與此類測試?
看完上面這些任務的內容,大抵就明白了。它們大多模擬人類日常生活中的常見操作,既能檢驗機器人在真實環境中的感知、抓取與協同操作能力,又能直觀暴露技術短板,為后續產品優化與技術迭代提供真實、可復現的測試依據,因此對推動機器人技術落地具有重要意義。
![]()
擁抱多樣化甚至是“混亂”的數據
“未來10年,這個世界上10%的人可以擁有自己的機器人。”在此前專訪中,千尋智能創始人兼CEO韓峰濤這樣告訴九千光年。
(新聞回顧?)
這位浙大背景的80后,與清華背景的高陽(聯合創始人兼首席科學家、“伯克利歸國四子之一”)攜手,于2024年初創辦千尋智能。
![]()
![]()
韓峰濤和高陽
團隊自起步便堅定走端到端的“視覺-語言-動作”(VLA)全自研路線。在他們看來,數據質量決定模型上限,而當前VLA大模型的訓練關鍵和挑戰,恰恰在于數據多樣性。
千尋智能在昨日發布的技術博客中,這樣寫道:“許多業界頂尖的模型主要在高度精選的,即所謂的‘干凈’數據集上進行訓練。”“雖然這種‘干凈’的路徑提供了一個穩定的起點,但它限制了機器人的泛化能力。如果機器人只在一切都清晰可見且觸手可及的世界中學習,那么當它在開放世界中面對不可預測性時,很可能會失敗。”
因此,千尋智能選擇在預訓練階段引入大量多樣化、很大程度上不受控的真實數據。數據采集不再嚴格限定任務腳本,而是以“完成有意義目標”為導向,允許操作過程中自然串聯多個子任務與原子技能。“如果我們希望機器人能應對人類家庭環境中的不可預測性,它們就需要從像真實世界一樣混亂的數據中學習。”
就在2025年12月下旬,全球首條實現人形具身智能機器人規模化落地的新能源動力電池PACK生產線,在寧德時代中州基地正式投入運行。千尋智能研發的人形機器人“小墨”搭載寧德時代自研電池,已能精準完成電池接插件插接等復雜作業。
![]()
附:
技術博客:
https://www.spirit-ai.com/en/blog/spirit-v1-5
RoboChallenge榜單地址:
https://robochallenge.cn/home
文 | 童蔚
VIEW MORE
@紐約時報這篇報道,讓美國網友破防了>>
@當AI眼鏡陷作弊疑云>>
@他用20年時間打破腔鏡手術機器人的進口壟斷>>
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.