機器人真正想要走向產業化,用于決策核心的“大腦”能力的突破才是關鍵,這已是行業共識。然而“大腦”的訓練需要燒掉海量數據燃料。具身智能數據基建戰,京東先吹響號角。
4月16日,京東具身智能數據中心的神秘面紗終于揭開。《每日經濟新聞》記者注意到,京東率先公布2000小時人類實操視頻具身智能數據集。同時發布自研超高清采集終端JoyEgoCam、具身大模型JoyAI-RA以及具身智能數據交易平臺。
同日,由智元機器人孵化的具身智能數據公司覓蜂科技正式亮相。覓蜂科技官網的“數據市場”板塊已上架467個具身智能訓練數據。其預計今年數據采集規模有望達到千萬小時。
2026年人形機器人半程馬拉松開賽在即,今年,300多臺機器人、上百支隊伍將同場競技。馬拉松比賽檢驗的是機器人負責運動、控制的“小腦”,具身智能公司百花齊放的今天,“小腦”能力的突破對絕大多數頭部公司來說,可能已經算不上難題。
而機器人想要走進千家萬戶以及產業側,負責感知、決策和執行的“大腦”必須高度發達。這需要海量、真實的物理世界數據。數據從哪來?如何采集和訓練?不同機器人本體數據如何互通復用?大廈落成,需要從造“磚”開始。
![]()
圖片來源:企業供圖
具身智能面臨“數據荒”
覓蜂科技董事長兼CEO(首席執行官)、智元機器人合伙人姚卯青公開表示,訓練類似ChatGPT-5級別的系統所需語料達百億小時量級,而具身智能可用數據僅在50萬小時量級,規模差距懸殊,還存在標準缺失、質量不一、供需錯配等問題。
與大語言模型相比,具身智能的數據積累無疑還處于早期階段。《每日經濟新聞》記者從京東方面了解到,其認為具身智能要達到真正可用,至少需要1000萬小時級別的真實場景交互數據。然而,當前行業數據規模僅約100萬小時,數據缺口高達10倍。
融資規模不斷被刷新,量產步伐全面提速,市場規模水漲船高,一年比一年熱鬧的具身智能賽道,深陷“數據荒漠”困境,背后必然有很多不可控因素。
京東方面告訴《每日經濟新聞》記者,首先是數據稀缺,真實場景交互數據獲取困難,成本高昂。傳統物理AI數據采集方式通常需要定制化機械臂、專用傳感器、固定工位等,設備成本高昂、部署周期長。其次是泛化不足,模型難以適應不同環境和任務場景。最后是不同機器人本體數據無法互通復用,形成了“數據孤島”。
因此,具身智能數據鏈路的第一步是數據采集。最底層是硬件層,包括頭戴設備、數據采集手套、機器人本體等“身體部件”。
記者注意到,京東云發布了自研的可穿戴式超高清采集終端JoyEgoCam。其配備4K高清攝像頭,支持60幀幀率與130度超廣角拍攝,可實現毫秒級動作細節捕捉。在精準度方面,重投影誤差小于0.2像素。
此外,覓蜂科技也推出了MEgo系列無本體數據采集硬件,包含采集夾爪、頭戴式采集設備等。設備具備超300度全景感知與亞毫秒級數據同步能力。
通過可穿戴設備,普通人也可以在工廠、物流、零售、醫療以及家庭等環境中完成數據采集,從而降低數據采集門檻,拓展采集場景。
京東此前發動數十萬人參與數據采集,包括內部超過10萬名各類職業員工,以及外部最多50萬各行業人員,其中在宿遷就將發動超10萬市民參與。記者還注意到,京東率先在平臺公布了2000小時人類實操視頻具身智能數據集。
據京東方面稱,未來將構建全球規模最大的具身智能數據采集中心,在兩年內積累1000萬小時人類真實場景視頻數據。
海量數據還需模型訓練 機器人也需要“救護車”
數據采集完成后,這些數據如何真正融入機器人的“大腦”?京東具身智能相關負責人告訴《每日經濟新聞》記者,底層硬件設備完成物理世界真實數據采集后,需要被送至“工具層”,可以理解為用一個“工具箱”進行數據處理、模型訓練以及仿真評測等。
“再往上就是模型層,也就是所謂的‘大腦’,包含VLA模型(視覺—語言—動作模型)、VLN模型(視覺—語言導航)、世界模型等核心能力。最頂層就是應用層,就是這些技術最終落地的場景,比如家政服務、物流配送、醫療輔助、零售服務、工業制造等。”該負責人透露。
記者了解到,京東為此上線了具身數據服務平臺和京東云JoyBuilder模型開發平臺。
去年京東在具身智能領域罕見地完成了“六連投”,比起絕大部分互聯網大廠的純財務投資,京東幾乎是自家業務、全場景關聯具身智能賽道。具身智能數據中心是整個京東具身智能戰略的一環。
![]()
圖片來源:企業供圖
機器人半馬開賽之前,4月15日,京東宣布正式推出“機器人救護車”,為人形機器人、四足機器人、AI陪伴機器人等提供維修保養服務,涵蓋基礎維修、故障診斷、換電補能、設備回收等全場景需求。目前,京東“機器人救護車”已率先服務北京地區,未來3年,機器人上門維修服務還將拓展至全國超50個核心城市。
此外,京東還宣布,加速機器人行業商業化和場景落地,目標在2026年助推機器人品牌累計銷售規模突破百億元、產品上市周期縮短20%,為此會打通線上App、線下門店、Joybuy海外平臺等全渠道銷售網絡。
機器人如何在物流、家庭、工業等真實土壤中真正“活”起來?這仍是一個需要無數機器人本體公司、具身智能數據公司深入思考并為之傾盡所有的問題和過程。這場具身智能基建戰沒有終局,誰先鋪好路、燒足數據燃料,誰就更有可能在機器人“大腦”時代的競速中,占據下一個10年的制高點。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.