網易首頁 > 網易號 > 正文申請入駐

很多人沒看懂，京東做具身智能數據中心的真正邏輯

2026-03-23 21:37:19　來源: 新眸深度

江蘇舉報

分享至

新眸原創·作者 | 棠寧

“看發布會演示的時候什么都能做，一到自己家，就跟換了個腦子一樣。”類似這樣有關人形機器人的吐槽，社交媒體上并不少。后來也和幾位做機器人研發的朋友聊起這件事，他們說這幾乎是整個行業的通病。

現在的具身智能模型，在實驗室的固定場景里，完成指定任務的準確率能到90%以上，可一旦放到充滿不確定性的真實環境里，性能直接腰斬，甚至直接失靈。問他們核心瓶頸是什么，幾乎所有人的答案都一樣：缺數據，缺真實世界里的、有血有肉的場景數據。

就在全行業都在卷模型參數、卷硬件性能、卷仿真環境的時候，京東悄悄扔出了一個重磅動作。最近舉行的中國發展高層論壇上，京東集團CEO許冉對外披露：京東正在建設全球規模最大、場景最全的具身智能數據中心，兩年內將積累超過1000萬小時的真實場景數據，覆蓋物流、家庭、城市等五大核心場景，未來會向全行業開放這些數據資源。

很多人聽到這個消息的第一反應是，京東不是做零售和物流的嗎，怎么突然下場做具身智能的數據基礎設施了？但如果你了解京東這家公司的發展邏輯，就會發現，這件事不僅不跨界，反而恰恰是京東為自己的下半場，埋下的最關鍵的一步棋。

具身智能狂奔三年

終于撞上了數據的天花板

具身智能已經連續兩年被寫入政府工作報告，明確列入未來產業的重點培育方向，資本端的熱度更是居高不下。2026年開年不到三個月，國內具身智能領域已經披露的融資總額就接近150億元，估值超百億的企業擴容到了7家。不管是科技巨頭還是創業公司，都在往這個賽道里擠，所有人都知道，這是下一代人工智能的核心方向，也是未來十年最大的產業機會之一。

但熱鬧的背后，行業的瓶頸已經越來越清晰。之前大家都覺得，制約具身智能發展的是算力，是模型，是硬件本體。但隨著這兩年技術的快速迭代，這些門檻都在快速降低。根據IDC發布的數據，2025年中國智能算力規模達到1037.3EFLOPS，同比增長43%，預計2028年將突破2700EFLOPS。

算力的價格越來越低，只要有資金，就能買到足夠的算力支撐模型訓練。模型架構也日趨同質化，開源社區的成熟，讓很多創業公司都能基于開源模型，快速做出自己的具身智能方案。硬件方面，電機、減速器這些核心零部件的成本，也在快速下降，人形機器人的整機價格，已經從幾年前的幾十萬，降到了現在的幾萬塊。

這個時候，整個行業的核心矛盾，已經從“有沒有足夠的算力和模型”，變成了“有沒有足夠的真實數據喂飽模型”。多位行業研發人員都提到過，目前全行業可用于具身智能訓練的真實場景數據，加起來也只有幾十萬小時，和實現智能涌現需要的千萬甚至上億小時的規模，差了一個數量級都不止。

之前很多人覺得，仿真環境可以解決這個問題。在虛擬環境里，我們可以無限生成場景，無限生成訓練數據，成本低，效率高。但這幾年的實踐下來，大家發現仿真和真實世界之間，有一道很難跨越的鴻溝。

就像我們在駕校里練車，哪怕把每一個點位都背得滾瓜爛熟，考試次次滿分，真的開到真實的馬路上，還是會手忙腳亂。因為駕校的場景是固定的，路線是固定的，甚至連突發狀況都是預設好的，而真實的馬路，每一秒都在發生變化，你永遠不知道下一個路口會竄出來什么。

具身智能也是一樣。在仿真環境里，機器人訓練的場景，都是程序員預設好的，地面永遠是平整的，物體永遠是固定的，光線永遠是均勻的。但真實的家庭里，地上會有散落的玩具和拖鞋，桌子上的杯子會隨意擺放，早上和晚上的光線天差地別；真實的倉庫里，貨物的包裝千奇百怪，托盤的位置會有偏差，甚至連地面都會因為貨物的重壓有輕微的變形。

這些細微的、不確定的變化，仿真環境很難完全模擬，而恰恰是這些變化，決定了機器人在真實場景里能不能用。

許冉在論壇演講中提到，2026年春節期間，人形機器人成為最搶手的電子年貨，相關產品的搜索量同比增長超過300%，但當前機器人消費的增長，很大程度上受限于供給的不足。這里的供給不足，不僅是硬件產能的不足，更是智能能力的不足——沒有足夠的真實數據喂養，機器人很難具備應對復雜真實場景的能力，也就無法真正走進普通人的生活。

京東的下半場

把場景做成了最核心的資產

今年3月，京東發布了2025年的全年財報，總營收首次突破1.3萬億元，達到13091億元，同比增長13%。這個成績，在當下的電商行業里，已經相當穩健。但拆開來看，增長的結構已經發生了根本性的變化。全年商品收入10238億元，同比增長10.3%；而服務收入達到2853億元，同比增長23.6%，增速是商品收入的兩倍還多，占總營收的比重，也提升到了21.8%，創下了歷史新高。

這個數據的變化，背后是京東增長邏輯的切換。過去二十多年，京東的核心增長引擎，是零售電商，靠自營模式和自建物流，建立起了自己的行業壁壘。但現在，國內電商行業的流量紅利已經基本見頂，增速持續放緩，僅靠商品銷售的增長，已經很難支撐京東的長期發展。

京東的下半場，必須從一個“賣商品的交易平臺”，轉向一個“提供技術服務的服務商”。

這一點，從京東這幾年的布局里就能看出來。京東物流已經獨立上市，從服務京東自身，轉向服務全行業的供應鏈客戶；京東工業也在港交所上市，專注于工業供應鏈的技術服務；還有京東云，這幾年一直在快速擴張，為企業提供數字化轉型的解決方案。服務收入的持續高增長，已經證明了京東的轉型方向是成立的。

但想要在技術服務這條路上走得更遠，京東需要一個更核心的抓手，一個能把自己過去二十多年積累的核心能力，完全釋放出來的載體。而具身智能，就是這個最合適的載體。

很多人對京東的認知，還停留在“電商公司”，但其實從成立的第一天起，京東就在和物理世界打交道。零售的本質，是商品的流通，而商品的流通，全都是在物理世界里完成的。從采購、倉儲、分揀，到配送、售后，京東的整個業務鏈條，都是扎根在真實的物理場景里的。

過去二十多年，京東一直在做的事情，就是用技術優化物理世界的供應鏈效率，自建物流是這樣，亞洲一號智能倉儲是這樣，現在的具身智能數據中心，也是這樣。

就在三個月前，京東全國首個機器人數據采集中心在江蘇宿遷正式啟用。這個總投資超億元、占地面積5000平方米的項目，已經入選江蘇省2025年度具身智能機器人產業發展資金支持項目。從宿遷的落地項目到全國性的布局，京東在具身智能基礎設施上的動作正在加速。

這也是京東和其他科技巨頭最大的不同。京東擁有國內幾乎獨一無二的場景資源，根據官方披露的信息，京東在全國布局了超過1400個倉庫，其中亞洲一號智能倉儲園區已經超過50個，園區里運行著數萬臺AGV機器人、分揀機器人、碼垛機器人，每天要完成數百萬次的貨物搬運、分揀、碼垛操作。

這些機器人，不是在實驗室里跑測試，而是在真實的業務環境里，每天24小時不間斷地工作，它們的每一次移動、每一次操作、每一次應對突發狀況的調整，都會產生完整的、多維度的真實數據。這些數據，就是訓練具身智能模型最優質的素材。

除了倉儲物流，京東還有零售門店、京東到家的本地生活場景、京東健康的醫療服務場景、京東城市的城市運維場景，這些場景，全都是真實的、每天都在運轉的物理世界場景，每天都在產生海量的、和人類真實活動相關的數據。這些場景資源，是其他大廠花再多錢，也很難在短時間內復制的。

京東正在建設的具身智能數據中心，本質上就是把這些場景資源，轉化成可復用的數據資產。這個數據中心，和我們傳統認知里的IDC機房、通用智算中心，完全不是一回事。傳統的數據中心，核心是提供算力存儲和通用計算能力，處理的是文本、圖像、視頻這些線上的數字內容。而具身智能數據中心，是針對具身智能的技術特點，搭建的一套“采集-標注-訓練-驗證”全流程的基礎設施，它的核心，是真實物理世界數據的生產、處理和應用。

除了自有的業務場景，京東還在通過大規模的眾包采集，擴充數據的覆蓋范圍。按照規劃，京東將發動內部超過10萬名各類職業的員工，以及外部最多50萬名各行業的人員，參與數據采集工作，僅在江蘇宿遷一地，就將發動超過10萬名市民參與，覆蓋家庭、辦公室、工廠、餐廳、醫療、環衛等上百個細分場景，全面還原人類的真實活動。

最終的目標，是一年內積累500萬小時的人類真實場景視頻數據，兩年內突破1000萬小時，同步采集機器人本體數據100萬小時。這個規模，不僅超過了目前行業所有公開數據集的總和，更重要的是，它構建了一個覆蓋人類生產生活全場景的、持續更新的真實世界數字孿生體。

一個數據中心

能改寫具身智能的行業格局嗎？

在具身智能這條萬億級的賽道上，幾乎所有的科技巨頭都已經下場，只是各自的路徑選擇有所不同。

華為的核心思路是全棧布局，從底層的算力芯片、操作系統，到上層的智能體開發平臺，形成完整的技術閉環；阿里的布局則是軟硬一體，比如最近阿里成立了直接由CEO吳泳銘負責的ATH 事業群，整合了通義實驗室、千問大模型等核心技術資源，從底層模型向應用場景大擴容，To B和To C雙線并進。騰訊的重點是機器人操作系統，推出了TAIROS平臺，整合了AI Lab的強化學習算法與云計算能力，為第三方機器人提供感知、決策與交互的通用大腦。百度則是依托文心大模型的技術積累，重點推進大模型與具身智能的結合，在工業、交通等場景落地智能解決方案。

對比這些巨頭的布局可以發現，他們的優勢，都集中在技術層、軟件層，有很強的模型能力、算力能力、系統能力，但都有一個共同的短板：缺乏大規模的、持續運轉的、自己完全可控的真實物理場景。他們可以做出很牛的模型，但很難拿到足夠的真實場景數據，來讓模型真正落地。

而京東，恰恰補上了這塊行業最缺的拼圖。

熟悉人工智能發展歷史的人應該都知道，2009年ImageNet數據集的出現，直接推動了計算機視覺技術的爆發式發展，讓CV技術從實驗室，真正走向了大規模的商業應用。而京東正在構建的這個千萬小時級的具身智能數據集，很有可能成為具身智能領域的“ImageNet時刻”，推動整個行業，從仿真模擬的實驗室階段，真正走向真實數據驅動的商用落地階段。

更重要的是，京東可以通過這個數據中心，形成一個完整的商業閉環。用自有場景產生的數據，訓練出更優的具身智能模型，再把模型應用到自己的物流、零售等業務中，提升供應鏈的效率，降低運營成本。而業務的優化，又會產生更多、更優質的數據，進一步優化模型，形成一個正向的飛輪。

當模型的能力足夠成熟之后，再把數據和模型能力，開放給全行業的機器人企業、科研機構和開發者，帶來新的服務收入，同時又能從更多的行業場景中，獲取新的數據，讓飛輪轉得越來越快。

這個飛輪的起點，就是這個具身智能數據中心。它不僅是京東自身技術升級的基礎設施，更是京東向產業互聯網服務商轉型的核心抓手。

當然，這條路也并非一片坦途，京東依然要跨越多重挑戰。

首先是大規模的資金投入壓力。具身智能數據中心的建設，不管是數據采集設備的部署、算力集群的搭建，還是大規模的眾包采集、數據標注，都需要巨額的資金投入。雖然目前核心零售業務能提供穩定的現金流，但持續的大規模投入，依然會給集團的盈利表現帶來不小的壓力。

其次是數據標準化和合規的問題。京東的數據集來自五大核心場景、上百個細分場景，不同場景的數據格式、標注標準都有很大的差異，如何把這些分散的數據，統一成標準化的、全行業都能通用的數據集，是一個不小的技術難題。同時，大規模的眾包采集，涉及到大量的個人信息和場景數據，如何確保數據采集的合規性，保護用戶的隱私，也是京東必須解決的問題。

第三是底層技術的短板。京東在場景和數據上，有著無可替代的優勢，但在底層的大模型算法、算力芯片、機器人操作系統等核心技術上，和華為、百度等廠商相比，還有一定的差距。具身智能的發展，是數據、算法、算力的協同進化，只有數據，沒有足夠強的算法和算力支撐，也很難充分發揮數據的價值。

不過回頭看，京東這家公司，從來都不是靠走捷徑取勝的。2007年，劉強東力排眾議要自建物流的時候，幾乎所有人都覺得他瘋了，一個電商公司，要做這么重的資產，燒這么多錢，根本就是死路一條。但京東扛住了連續多年的虧損，把物流做成了自己最核心的壁壘，也徹底改變了中國電商行業的履約體驗。

現在的具身智能數據中心，其實和當年的自建物流，是一模一樣的邏輯。行業里的所有人都知道真實數據重要，但愿意花這么大的代價，去做這么重、這么苦、這么慢的事情的公司，少之又少。而京東，恰恰最擅長做這種難而正確的事情。

互聯網發展到今天，上半場的競爭，是數字世界的競爭，大家拼的是流量，是信息分發的效率，是線上體驗的優化。而下半場的競爭，已經變成了數字世界和物理世界融合的競爭，誰能把數字技術，真正落地到物理世界的真實場景里，提升物理世界的運行效率，誰就能拿到下半場的船票。

京東的上半場，用了二十多年的時間，把中國商品流通的效率，做到了極致。而京東的下半場，很有可能就是從這個具身智能數據中心開始，把物理世界的智能效率，做到新的極致。時間總會給堅持做長期正確事情的人，最好的答案。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.