網易首頁 > 網易號 > 正文申請入駐

登頂全球榜單后，他們把自研的具身智能“大腦”開源了

2026-01-13 08:04:08　來源: 九千光年

浙江舉報

分享至

熱熱鬧鬧了一整年，機器人在真實場景中干活的水平怎么樣了？

昨天，具身智能領域傳來的一則消息，或許能為我們帶來一個更為清晰的信號。

1月12日，千尋智能宣布開源自研的VLA（視覺-語言-動作）基礎模型Spirit v1.5。就在前一天，該模型在全球具身智能模型評測平臺RoboChallenge的綜合評測中一舉登頂，超越美國具身智能明星公司Physical Intelligence的Pi0.5。

在過去的2025年里，千尋智能旗下人形機器人Moz1頻繁活躍在北上廣深杭的各大展會上，疊衣服、串奶皮子糖葫蘆、搭積木、賣飲料、端盤子……而就在上個月下旬，它們的小伙伴“小墨”，正式成為寧德時代中州基地的“員工”，在生產線上開展實際工作。

全球榜單中

唯一成功率破50%的模型

Spirit v1.5是什么？

Spirit v1.5是千尋智能自主研發并開源的VLA基礎模型，將視覺感知、語言理解與動作生成整合在同一決策流程中，減少多模塊串聯帶來的信息損耗，并提升長程任務中的整體穩定性。

RoboChallenge又是什么？

它是一個面向真實機器人執行場景的標準化評測基準，由Dexmal（原力靈機）、Hugging Face（抱抱臉）等全球知名機構聯合發起，聚焦具身智能模型的跨平臺能力驗證。

這個平臺強調真實機器人執行能力，評測維度涵蓋復雜指令理解、多步驟操作、跨場景穩定性等，被業界視為當前具身智能領域最接近真實落地場景的基準測試之一。

具體測些什么？

本次測試包括30項操作任務（Table 30），像是插花、掛牙刷杯、尋找指定顏色的物體、貼膠條、將筆放入筆盒等。

在這些操作任務的測試中，Spirit v1.5綜合得分為66.09分，成功率達到50.33%，是唯一一個成功率超過50%的模型。

此前數月，在這份榜單上霸榜的是Pi0.5模型。它由Physical Intelligence于2025年4月發布，曾因能讓機器人在全新環境中完成復雜家務而引發網友熱議。

此次登頂，也意味著國產具身智能企業，正式躋身全球核心第一梯隊。

為了證實榜單成績源于自研模型且真實可信，千尋智能已同步開源Spirit v1.5的基模權重、推理代碼和使用樣例，并表示接受公眾與研究社區的獨立檢驗。

成功率100%的是疊碗

從榜單能不能看出機器人現在能做些什么？

先來看一些具體任務中的對比表現：

插花任務：Pi05夾起一枝花，但沒能插進花瓶，而是橫放在了瓶口；Spirit v1.5通過靈活調整關節，保證花枝豎直，并被插入花瓶中。

Pi05

Spirit v1.5

清理碗碟：Spirit v1.5可以準確夾起碗放入透明收納箱，同時將廢紙巾扔進前方綠桶；Pi0.5雖也能完成放碗動作，但偶爾會出現“機械式執行”——無法判斷是否已抓取物品，僅按固定步驟操作。

Pi05

Spirit v1.5

尋找綠盒：Spirit v1.5能從彩色方塊中鎖定綠色目標，準確夾取（該項任務成功率高達90%，在所有參與測試的模型中位列第一）；Pi05錯選了其中一個黃色方塊。

Pi05

Spirit v1.5

貼膠帶：Spirit v1.5可協調雙臂撕下一段膠帶，貼于快遞盒上；Pi0.5則未能成功撕下膠帶，僅做出一個貼附的“假動作”。貼膠帶屬于典型的閉環觸覺接觸任務，對機械臂協同與觸覺感知要求極高，常會出現“空抓”現象。

Pi0.5

Spirit v1.5

根據RoboChallenge官網公布的成績，在“疊碗”（將三只小碗疊放）任務中，Spirit v1.5獲得98分，成功率100%；將鋼筆放入筆盒、鞋子擺上架子、杯子放置杯墊等任務，成功率也都達到了90%。

為何要參與此類測試？

看完上面這些任務的內容，大抵就明白了。它們大多模擬人類日常生活中的常見操作，既能檢驗機器人在真實環境中的感知、抓取與協同操作能力，又能直觀暴露技術短板，為后續產品優化與技術迭代提供真實、可復現的測試依據，因此對推動機器人技術落地具有重要意義。

擁抱多樣化甚至是“混亂”的數據

“未來10年，這個世界上10%的人可以擁有自己的機器人。”在此前專訪中，千尋智能創始人兼CEO韓峰濤這樣告訴九千光年。

（新聞回顧?）

這位浙大背景的80后，與清華背景的高陽（聯合創始人兼首席科學家、“伯克利歸國四子之一”）攜手，于2024年初創辦千尋智能。

韓峰濤和高陽

團隊自起步便堅定走端到端的“視覺-語言-動作”（VLA）全自研路線。在他們看來，數據質量決定模型上限，而當前VLA大模型的訓練關鍵和挑戰，恰恰在于數據多樣性。

千尋智能在昨日發布的技術博客中，這樣寫道：“許多業界頂尖的模型主要在高度精選的，即所謂的‘干凈’數據集上進行訓練。”“雖然這種‘干凈’的路徑提供了一個穩定的起點，但它限制了機器人的泛化能力。如果機器人只在一切都清晰可見且觸手可及的世界中學習，那么當它在開放世界中面對不可預測性時，很可能會失敗。”

因此，千尋智能選擇在預訓練階段引入大量多樣化、很大程度上不受控的真實數據。數據采集不再嚴格限定任務腳本，而是以“完成有意義目標”為導向，允許操作過程中自然串聯多個子任務與原子技能。“如果我們希望機器人能應對人類家庭環境中的不可預測性，它們就需要從像真實世界一樣混亂的數據中學習。”

就在2025年12月下旬，全球首條實現人形具身智能機器人規模化落地的新能源動力電池PACK生產線，在寧德時代中州基地正式投入運行。千尋智能研發的人形機器人“小墨”搭載寧德時代自研電池，已能精準完成電池接插件插接等復雜作業。

附：

技術博客：

https://www.spirit-ai.com/en/blog/spirit-v1-5

RoboChallenge榜單地址：

https://robochallenge.cn/home

文 | 童蔚

VIEW MORE

@紐約時報這篇報道，讓美國網友破防了>>

@當AI眼鏡陷作弊疑云>>

@他用20年時間打破腔鏡手術機器人的進口壟斷>>

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.