![]()
新眸原創·作者 | 棠寧
“看發布會演示的時候什么都能做,一到自己家,就跟換了個腦子一樣。”類似這樣有關人形機器人的吐槽,社交媒體上并不少。后來也和幾位做機器人研發的朋友聊起這件事,他們說這幾乎是整個行業的通病。
現在的具身智能模型,在實驗室的固定場景里,完成指定任務的準確率能到90%以上,可一旦放到充滿不確定性的真實環境里,性能直接腰斬,甚至直接失靈。問他們核心瓶頸是什么,幾乎所有人的答案都一樣:缺數據,缺真實世界里的、有血有肉的場景數據。
就在全行業都在卷模型參數、卷硬件性能、卷仿真環境的時候,京東悄悄扔出了一個重磅動作。最近舉行的中國發展高層論壇上,京東集團CEO許冉對外披露:京東正在建設全球規模最大、場景最全的具身智能數據中心,兩年內將積累超過1000萬小時的真實場景數據,覆蓋物流、家庭、城市等五大核心場景,未來會向全行業開放這些數據資源。
很多人聽到這個消息的第一反應是,京東不是做零售和物流的嗎,怎么突然下場做具身智能的數據基礎設施了?但如果你了解京東這家公司的發展邏輯,就會發現,這件事不僅不跨界,反而恰恰是京東為自己的下半場,埋下的最關鍵的一步棋。
01
具身智能狂奔三年
終于撞上了數據的天花板
具身智能已經連續兩年被寫入政府工作報告,明確列入未來產業的重點培育方向,資本端的熱度更是居高不下。2026年開年不到三個月,國內具身智能領域已經披露的融資總額就接近150億元,估值超百億的企業擴容到了7家。不管是科技巨頭還是創業公司,都在往這個賽道里擠,所有人都知道,這是下一代人工智能的核心方向,也是未來十年最大的產業機會之一。
但熱鬧的背后,行業的瓶頸已經越來越清晰。之前大家都覺得,制約具身智能發展的是算力,是模型,是硬件本體。但隨著這兩年技術的快速迭代,這些門檻都在快速降低。根據IDC發布的數據,2025年中國智能算力規模達到1037.3EFLOPS,同比增長43%,預計2028年將突破2700EFLOPS。
算力的價格越來越低,只要有資金,就能買到足夠的算力支撐模型訓練。模型架構也日趨同質化,開源社區的成熟,讓很多創業公司都能基于開源模型,快速做出自己的具身智能方案。硬件方面,電機、減速器這些核心零部件的成本,也在快速下降,人形機器人的整機價格,已經從幾年前的幾十萬,降到了現在的幾萬塊。
這個時候,整個行業的核心矛盾,已經從“有沒有足夠的算力和模型”,變成了“有沒有足夠的真實數據喂飽模型”。多位行業研發人員都提到過,目前全行業可用于具身智能訓練的真實場景數據,加起來也只有幾十萬小時,和實現智能涌現需要的千萬甚至上億小時的規模,差了一個數量級都不止。
之前很多人覺得,仿真環境可以解決這個問題。在虛擬環境里,我們可以無限生成場景,無限生成訓練數據,成本低,效率高。但這幾年的實踐下來,大家發現仿真和真實世界之間,有一道很難跨越的鴻溝。
就像我們在駕校里練車,哪怕把每一個點位都背得滾瓜爛熟,考試次次滿分,真的開到真實的馬路上,還是會手忙腳亂。因為駕校的場景是固定的,路線是固定的,甚至連突發狀況都是預設好的,而真實的馬路,每一秒都在發生變化,你永遠不知道下一個路口會竄出來什么。
具身智能也是一樣。在仿真環境里,機器人訓練的場景,都是程序員預設好的,地面永遠是平整的,物體永遠是固定的,光線永遠是均勻的。但真實的家庭里,地上會有散落的玩具和拖鞋,桌子上的杯子會隨意擺放,早上和晚上的光線天差地別;真實的倉庫里,貨物的包裝千奇百怪,托盤的位置會有偏差,甚至連地面都會因為貨物的重壓有輕微的變形。
這些細微的、不確定的變化,仿真環境很難完全模擬,而恰恰是這些變化,決定了機器人在真實場景里能不能用。
許冉在論壇演講中提到,2026年春節期間,人形機器人成為最搶手的電子年貨,相關產品的搜索量同比增長超過300%,但當前機器人消費的增長,很大程度上受限于供給的不足。這里的供給不足,不僅是硬件產能的不足,更是智能能力的不足——沒有足夠的真實數據喂養,機器人很難具備應對復雜真實場景的能力,也就無法真正走進普通人的生活。
02
京東的下半場
把場景做成了最核心的資產
今年3月,京東發布了2025年的全年財報,總營收首次突破1.3萬億元,達到13091億元,同比增長13%。這個成績,在當下的電商行業里,已經相當穩健。但拆開來看,增長的結構已經發生了根本性的變化。全年商品收入10238億元,同比增長10.3%;而服務收入達到2853億元,同比增長23.6%,增速是商品收入的兩倍還多,占總營收的比重,也提升到了21.8%,創下了歷史新高。
這個數據的變化,背后是京東增長邏輯的切換。過去二十多年,京東的核心增長引擎,是零售電商,靠自營模式和自建物流,建立起了自己的行業壁壘。但現在,國內電商行業的流量紅利已經基本見頂,增速持續放緩,僅靠商品銷售的增長,已經很難支撐京東的長期發展。
京東的下半場,必須從一個“賣商品的交易平臺”,轉向一個“提供技術服務的服務商”。
這一點,從京東這幾年的布局里就能看出來。京東物流已經獨立上市,從服務京東自身,轉向服務全行業的供應鏈客戶;京東工業也在港交所上市,專注于工業供應鏈的技術服務;還有京東云,這幾年一直在快速擴張,為企業提供數字化轉型的解決方案。服務收入的持續高增長,已經證明了京東的轉型方向是成立的。
但想要在技術服務這條路上走得更遠,京東需要一個更核心的抓手,一個能把自己過去二十多年積累的核心能力,完全釋放出來的載體。而具身智能,就是這個最合適的載體。
很多人對京東的認知,還停留在“電商公司”,但其實從成立的第一天起,京東就在和物理世界打交道。零售的本質,是商品的流通,而商品的流通,全都是在物理世界里完成的。從采購、倉儲、分揀,到配送、售后,京東的整個業務鏈條,都是扎根在真實的物理場景里的。
過去二十多年,京東一直在做的事情,就是用技術優化物理世界的供應鏈效率,自建物流是這樣,亞洲一號智能倉儲是這樣,現在的具身智能數據中心,也是這樣。
就在三個月前,京東全國首個機器人數據采集中心在江蘇宿遷正式啟用。這個總投資超億元、占地面積5000平方米的項目,已經入選江蘇省2025年度具身智能機器人產業發展資金支持項目。從宿遷的落地項目到全國性的布局,京東在具身智能基礎設施上的動作正在加速。
這也是京東和其他科技巨頭最大的不同。京東擁有國內幾乎獨一無二的場景資源,根據官方披露的信息,京東在全國布局了超過1400個倉庫,其中亞洲一號智能倉儲園區已經超過50個,園區里運行著數萬臺AGV機器人、分揀機器人、碼垛機器人,每天要完成數百萬次的貨物搬運、分揀、碼垛操作。
這些機器人,不是在實驗室里跑測試,而是在真實的業務環境里,每天24小時不間斷地工作,它們的每一次移動、每一次操作、每一次應對突發狀況的調整,都會產生完整的、多維度的真實數據。這些數據,就是訓練具身智能模型最優質的素材。
除了倉儲物流,京東還有零售門店、京東到家的本地生活場景、京東健康的醫療服務場景、京東城市的城市運維場景,這些場景,全都是真實的、每天都在運轉的物理世界場景,每天都在產生海量的、和人類真實活動相關的數據。這些場景資源,是其他大廠花再多錢,也很難在短時間內復制的。
京東正在建設的具身智能數據中心,本質上就是把這些場景資源,轉化成可復用的數據資產。這個數據中心,和我們傳統認知里的IDC機房、通用智算中心,完全不是一回事。傳統的數據中心,核心是提供算力存儲和通用計算能力,處理的是文本、圖像、視頻這些線上的數字內容。而具身智能數據中心,是針對具身智能的技術特點,搭建的一套“采集-標注-訓練-驗證”全流程的基礎設施,它的核心,是真實物理世界數據的生產、處理和應用。
除了自有的業務場景,京東還在通過大規模的眾包采集,擴充數據的覆蓋范圍。按照規劃,京東將發動內部超過10萬名各類職業的員工,以及外部最多50萬名各行業的人員,參與數據采集工作,僅在江蘇宿遷一地,就將發動超過10萬名市民參與,覆蓋家庭、辦公室、工廠、餐廳、醫療、環衛等上百個細分場景,全面還原人類的真實活動。
最終的目標,是一年內積累500萬小時的人類真實場景視頻數據,兩年內突破1000萬小時,同步采集機器人本體數據100萬小時。這個規模,不僅超過了目前行業所有公開數據集的總和,更重要的是,它構建了一個覆蓋人類生產生活全場景的、持續更新的真實世界數字孿生體。
03
一個數據中心
能改寫具身智能的行業格局嗎?
在具身智能這條萬億級的賽道上,幾乎所有的科技巨頭都已經下場,只是各自的路徑選擇有所不同。
華為的核心思路是全棧布局,從底層的算力芯片、操作系統,到上層的智能體開發平臺,形成完整的技術閉環;阿里的布局則是軟硬一體,比如最近阿里成立了直接由CEO吳泳銘負責的ATH 事業群,整合了通義實驗室、千問大模型等核心技術資源,從底層模型向應用場景大擴容,To B和To C雙線并進。騰訊的重點是機器人操作系統,推出了TAIROS平臺,整合了AI Lab的強化學習算法與云計算能力,為第三方機器人提供感知、決策與交互的通用大腦。百度則是依托文心大模型的技術積累,重點推進大模型與具身智能的結合,在工業、交通等場景落地智能解決方案。
對比這些巨頭的布局可以發現,他們的優勢,都集中在技術層、軟件層,有很強的模型能力、算力能力、系統能力,但都有一個共同的短板:缺乏大規模的、持續運轉的、自己完全可控的真實物理場景。他們可以做出很牛的模型,但很難拿到足夠的真實場景數據,來讓模型真正落地。
而京東,恰恰補上了這塊行業最缺的拼圖。
熟悉人工智能發展歷史的人應該都知道,2009年ImageNet數據集的出現,直接推動了計算機視覺技術的爆發式發展,讓CV技術從實驗室,真正走向了大規模的商業應用。而京東正在構建的這個千萬小時級的具身智能數據集,很有可能成為具身智能領域的“ImageNet時刻”,推動整個行業,從仿真模擬的實驗室階段,真正走向真實數據驅動的商用落地階段。
更重要的是,京東可以通過這個數據中心,形成一個完整的商業閉環。用自有場景產生的數據,訓練出更優的具身智能模型,再把模型應用到自己的物流、零售等業務中,提升供應鏈的效率,降低運營成本。而業務的優化,又會產生更多、更優質的數據,進一步優化模型,形成一個正向的飛輪。
當模型的能力足夠成熟之后,再把數據和模型能力,開放給全行業的機器人企業、科研機構和開發者,帶來新的服務收入,同時又能從更多的行業場景中,獲取新的數據,讓飛輪轉得越來越快。
這個飛輪的起點,就是這個具身智能數據中心。它不僅是京東自身技術升級的基礎設施,更是京東向產業互聯網服務商轉型的核心抓手。
當然,這條路也并非一片坦途,京東依然要跨越多重挑戰。
首先是大規模的資金投入壓力。具身智能數據中心的建設,不管是數據采集設備的部署、算力集群的搭建,還是大規模的眾包采集、數據標注,都需要巨額的資金投入。雖然目前核心零售業務能提供穩定的現金流,但持續的大規模投入,依然會給集團的盈利表現帶來不小的壓力。
其次是數據標準化和合規的問題。京東的數據集來自五大核心場景、上百個細分場景,不同場景的數據格式、標注標準都有很大的差異,如何把這些分散的數據,統一成標準化的、全行業都能通用的數據集,是一個不小的技術難題。同時,大規模的眾包采集,涉及到大量的個人信息和場景數據,如何確保數據采集的合規性,保護用戶的隱私,也是京東必須解決的問題。
第三是底層技術的短板。京東在場景和數據上,有著無可替代的優勢,但在底層的大模型算法、算力芯片、機器人操作系統等核心技術上,和華為、百度等廠商相比,還有一定的差距。具身智能的發展,是數據、算法、算力的協同進化,只有數據,沒有足夠強的算法和算力支撐,也很難充分發揮數據的價值。
不過回頭看,京東這家公司,從來都不是靠走捷徑取勝的。2007年,劉強東力排眾議要自建物流的時候,幾乎所有人都覺得他瘋了,一個電商公司,要做這么重的資產,燒這么多錢,根本就是死路一條。但京東扛住了連續多年的虧損,把物流做成了自己最核心的壁壘,也徹底改變了中國電商行業的履約體驗。
現在的具身智能數據中心,其實和當年的自建物流,是一模一樣的邏輯。行業里的所有人都知道真實數據重要,但愿意花這么大的代價,去做這么重、這么苦、這么慢的事情的公司,少之又少。而京東,恰恰最擅長做這種難而正確的事情。
互聯網發展到今天,上半場的競爭,是數字世界的競爭,大家拼的是流量,是信息分發的效率,是線上體驗的優化。而下半場的競爭,已經變成了數字世界和物理世界融合的競爭,誰能把數字技術,真正落地到物理世界的真實場景里,提升物理世界的運行效率,誰就能拿到下半場的船票。
京東的上半場,用了二十多年的時間,把中國商品流通的效率,做到了極致。而京東的下半場,很有可能就是從這個具身智能數據中心開始,把物理世界的智能效率,做到新的極致。時間總會給堅持做長期正確事情的人,最好的答案。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.