![]()
新智元報道
編輯:Aeneas 犀牛
【新智元導讀】一只四足機器狗,無需預設路線、無需人工遙控,在開放城市環(huán)境中自己認路、自己走、自己干活——這是高德「途途」正在上演的真實場景。背后的秘密,是一套終結(jié)「一機一圖」困局的具身智能Harness——ABot-Claw。
具身智能的破曉時刻來了!
就在剛剛,2026北京亦莊機器人半程馬拉松上,阿里巴巴旗下高德正式公開全球首款開放環(huán)境全自主具身機器人「高德途途」。
![]()
這款四足機器人成功協(xié)助視障人士完成復雜避障、人群穿行等實戰(zhàn)挑戰(zhàn),突破了「實驗室」到「開放環(huán)境」之間的技術(shù)鴻溝。
我們早已習慣LLM在數(shù)字世界的無所不能,然而一旦觸及物理實體,以前的具身智能往往會碰壁。
比如,你對著一只機器狗說:帶我去最近的公園放松一下。
傳統(tǒng)機器人會大概率是一臉茫然——它不知道公園在哪,不知道怎么走,更不知道「放松」意味著什么。
就算你把路線告訴它,它也只能按圖索驥,遇到施工封路就徹底抓瞎。
這種「知識孤島」的工程瓶頸,正是具身智能通往通用AGI的最大絆腳石。
現(xiàn)在,高德正式發(fā)布了全球首個面向AGI的全棧具身技術(shù)體系ABot,以及智能導盲犬高德途途。
這不僅是一臺「能出門、會思考、能導盲」的四足機器人,更是一次對具身智能底層邏輯的重構(gòu)。
跟傳統(tǒng)的機器狗不一樣,高德的四足機器人途途會先理解你的意圖——你累了、想透氣,接著查詢自己的「記憶庫」找到最近的公園坐標,然后把任務拆解成一系列子目標,最后一路導航到目的地。
如果中途遇到障礙,它會實時調(diào)整路線,甚至在你沒察覺的情況下繞開一群正在遛彎的大爺大媽。
比如,它甚至可以直接出門到咖啡店里給你取一杯咖啡。
特別是作為體系中樞的ABot-Claw,它的出現(xiàn),意味著具身智能終于迎來了屬于自己的「Harness」(智能駕馭中樞)。
![]()
高德,正在用自己的空間智能沉淀,開啟具身智能通向AGI的大門。
傳統(tǒng)具身智能的致命傷
一機一圖、知識孤島、單體脆弱
長期以來,具身智能領域有一個幾乎無解的工程困境,業(yè)內(nèi)稱之為「一機一圖」。
什么意思?
每臺機器人部署到新環(huán)境時,必須從零開始:獨立建圖、獨立冷啟動、獨立訓練。
今天這臺機器人在A辦公室學會了怎么找會議室,明天換一臺新機器人到B辦公室,一切就得從頭再來,經(jīng)驗無法沉淀,知識無法復用。
這就像一家公司每招一個新員工,都得從幼兒園開始教——認字、學加減法、了解公司業(yè)務,從零培養(yǎng)到能上手,然后他一離職,下一個人再來一遍。
這就是當前機器人行業(yè)的普遍現(xiàn)狀。
更致命的是,單體機器人極度脆弱。它們只能圍繞眼前的世界建模,眼睛看不到的地方就是未知黑洞。
電梯門關(guān)了,它不知道樓上是什么;前方轉(zhuǎn)角有人走過來,它無法預判。
沒有記憶、沒有協(xié)同、沒有容錯——這就是為什么大部分機器人只能在封閉場景里做做搬運工作,一旦走出實驗室,立刻變成不會走路的「科技盲人」。
答案來了:從「單體能力展示」到「系統(tǒng)級解法」
高德途途的出現(xiàn),打破了這一僵局!
作為一個「開了天眼」的四足機器人,它在開放環(huán)境下無需預設路線,無需人工遙控,就能自己認路、自己走。 哪怕是超視距外的路況變化,它也能提前預判。
之所以能支撐這種通用能力,真正的秘密在于,它換了一套底層操作系統(tǒng)——ABot-Claw。
如果把機器人比作一匹馬,過去的做法是不斷給馬喂更好的飼料、做更多的訓練,希望它跑得更快更遠。
而Harness的思路是:給馬裝上韁繩和馬鞍,讓騎手能真正駕馭它。
ABot-Claw處于ABot技術(shù)體系的Agent層,承上啟下:向下接收ABot-M0(操作模型)和ABot-N0(導航模型)的能力輸出,向上統(tǒng)一調(diào)度四足、輪式、人形等不同形態(tài)的機器人本體。
![]()
它不是又一個基座模型,而是讓基座模型能力真正落地的「中樞神經(jīng)系統(tǒng)」,從此,機器人從「被動執(zhí)行器」升級為「主動調(diào)度者」。
它不再是一個只會聽命令的工具,而是一個能理解意圖、規(guī)劃路徑、執(zhí)行任務、自我糾錯的智能體。
從此,具身智能從「單體試錯」時代,正式邁入「體系智能」階段。
值得一提的是,ABot體系的Model層也交出了亮眼成績單。
ABot-M0操作基座模型在Libero、Libero-Plus、RoboCasa、RoboTwin 2.0等四大權(quán)威基準測試中全面刷新世界紀錄,Libero-Plus基準上任務成功率高達80.5%,較業(yè)界標桿Pi0提升近30%。
![]()
ABot-N0導航基座模型更是全球首次用單一模型統(tǒng)一五大核心導航任務,在CityWalker、SocNav、R2R-CE、RxR-CE、HM3D-OVON、BridgeNav、EVT-Bench等7項國際評測中全部達到SOTA,斷層式領先行業(yè)。
![]()
而這一切能力的落地,都需要通過Claw這個「中樞神經(jīng)」來駕馭。
Claw如何重構(gòu)具身底座
如果說模型是大腦,那么ABot-Claw就是連接大腦與四肢、并賦予其長期記憶的中樞神經(jīng)。
![]()
它通過三大核心技術(shù)支柱,徹底終結(jié)了機器人的「失憶癥」。
通過Map as Memory、集中式動態(tài)調(diào)度、分層容錯機制,它從數(shù)據(jù)流與控制流底層,徹底終結(jié)了「一機一圖」的歷史。
Map as Memory,讓地圖成為世界記憶
跨機器人本體空間記憶系統(tǒng)(Cross-Embodiment Spatial Memory)以全局空間坐標系為統(tǒng)一參考框架,構(gòu)建支持多模態(tài)感知數(shù)據(jù)(視覺關(guān)鍵幀、物體6D位姿、語義坐標、行為軌跡)持久化存儲于聯(lián)合索引的分布式記憶架構(gòu)。
該系統(tǒng)支持:
多粒度空間語義建模:通過分層拓撲結(jié)構(gòu)(區(qū)域?qū)印⒙肪W(wǎng)層、功能層、對象層)實現(xiàn)從宏觀導航到微觀操作的語義-幾何對齊;
混合檢索機制(Hybrid Retrival):融合幾何約束(如空間半徑查詢)與語義相似度(如CLIP嵌入匹配),支持開放詞匯條件下的跨模態(tài)召回;
上下文零遷移繼承:新接入機器人可通過訂閱全局空間語義圖譜,直接復用歷史觀測與任務上下文,實現(xiàn)跨設備、跨任務周期的持續(xù)認知一致性。
這是高德最有野心的一個創(chuàng)新,也是整個Claw體系的靈魂。
傳統(tǒng)機器人的「記憶」,大多是傳感器采集的局部數(shù)據(jù)、執(zhí)行過的任務日志。這些信息高度碎片化,無法跨設備共享,更無法形成持久化的認知基礎。
高德的做法是:把地圖升維成智能體的持久化記憶載體。
想想看,人類是怎么「記住」世界的?我們對長期生活的地方有空間記憶,知道家里廚房在哪、公司電梯怎么走;我們對打交道的人有關(guān)系記憶,了解同事的習慣和喜好。
這些記憶讓我們能在復雜環(huán)境中游刃有余,而不是每次出門都像第一次來到這個世界。
ABot-Claw的Map as Memory做的就是這件事——以全局空間坐標為統(tǒng)一錨點,建立持久化空間語義地圖,讓機器人擁有真正的「世界記憶」。
具體怎么實現(xiàn)?
Claw構(gòu)建了一套四層視覺空間記憶架構(gòu):
BlockLayer(區(qū)域?qū)樱?/strong>:定義室內(nèi)房間和室外街區(qū),支持跨區(qū)域的粗粒度定位與長程任務分解。
Road Layer(路網(wǎng)層):刻畫物理連通性——交叉口、門洞、通道,提供路徑規(guī)劃的硬約束。
Function Layer(功能層):標注關(guān)鍵語義節(jié)點——休息區(qū)、廚房、電梯廳,將抽象語言意圖轉(zhuǎn)化為可導航的功能目標。
Object/POILayer(對象層):定位具體實體——特定商鋪、特定物品位置,作為「最后一米」導航的精確視覺-語義錨點。
有了這套分層拓撲記憶,機器人從「家門口出發(fā)」到「穿越城市街區(qū)」到「進入購物中心」到「找到特定餐廳的空位」,全程由統(tǒng)一的空間記憶框架支撐,無需在不同系統(tǒng)間切換。
![]()
更重要的是,這個記憶是可共享的。
通過以全局空間坐標為錨點的共享空間語義地圖,新設備只要連接網(wǎng)絡,就能通過讀取全局Context實現(xiàn)知識的「零成本繼承」。
一臺機器人走過的路、認出的物體,另一臺新機器人瞬間就能知道。
今天A機器人發(fā)現(xiàn)「三樓會議室門口有飲水機」,明天B機器人到同一棟樓執(zhí)行任務,直接就知道渴了去哪喝水。
這就是終結(jié)「一機一圖」的核心——知識不再綁定在單一設備上,而是沉淀在共享的世界記憶中,可繼承、可累積、可進化。
這套記憶系統(tǒng)還有一個精妙之處:它是動態(tài)可維護的。
每一次任務執(zhí)行的結(jié)果——無論成功還是失敗——都會作為新的觀測證據(jù)回寫到拓撲圖中。
臨時道路封閉、新開的店鋪、調(diào)整后的室內(nèi)布局,都能通過持續(xù)的「維護-反饋」機制動態(tài)更新。
高德每天處理的海量導航數(shù)據(jù)——來自衛(wèi)星、街景車、眾包探針——也會實時注入這套記憶系統(tǒng)。
這意味著機器人不僅能記住「靜態(tài)的世界」,還能感知「變化的世界」。
保障長程任務的連續(xù)性
有了共享記憶還不夠。
機器人執(zhí)行真實任務時,會遇到各種意外:電池快沒了、傳感器故障了、前面的路被堵了。傳統(tǒng)的單體架構(gòu)下,一個環(huán)節(jié)出問題,整個任務就崩盤。
ABot-Claw的解法是集中式調(diào)度與云邊協(xié)同。
首先,Claw首創(chuàng)了「一個運行時、多智能體共生」的具身智能范式。
統(tǒng)一的技能抽象打破了異構(gòu)機器人之間的邊界,機械臂、人形、四足,不管什么形態(tài),都可以在同一個框架下協(xié)同作業(yè)。
任務上下文能無縫移交——如果一臺四足機器人電量不足,另一臺可以接手繼續(xù)執(zhí)行,不需要重新理解任務、重新規(guī)劃路徑。
比如,這兩臺機器人協(xié)作給沙拉撒上胡椒粉。
其次,Claw采用「云端大腦-邊緣響應」的兩級架構(gòu)。
云端負責高層任務分解與規(guī)劃(L3/L4 Planning),邊緣側(cè)實現(xiàn)本地高頻實時控制(L1/L2 Control),確保物理安全與響應速度。
這就像人的大腦和脊髓反射的分工——你不需要每次眨眼都動用大腦皮層做決策,本能反應由脊髓搞定。
機器人遇到突發(fā)障礙時,不需要等云端響應,邊緣側(cè)直接避障,毫秒級響應。
這種架構(gòu)的好處是:即便網(wǎng)絡斷了,邊緣側(cè)仍能保證基本功能運轉(zhuǎn);云端重連后,立刻同步狀態(tài),無縫續(xù)上。
閉環(huán)反思:讓機器人「自我糾錯」的靈魂
但最讓人驚艷的,還是Claw的反思與糾錯。
傳統(tǒng)機器人執(zhí)行任務是線性的:接收指令→執(zhí)行動作→匯報結(jié)果。如果中間出了問題,要么卡死,要么報錯,等人工干預。
這就像一個只會背劇本的演員,一旦觀眾不按套路鼓掌,他就不知道怎么演了。
面對充滿不確定性的真實世界,高德首創(chuàng)了Closed-loop Reflection&Self-Correction(閉環(huán)反思與自我糾錯)機制,這就賦予了系統(tǒng)「嘗試-判斷-調(diào)整」的類人循環(huán)能力。
每個子任務完成后,系統(tǒng)的Self-Reflector模塊會對執(zhí)行結(jié)果進行評估。
如果成功,繼續(xù)下一步;如果失敗,反思器生成結(jié)構(gòu)化的失敗診斷反饋,觸發(fā)規(guī)劃器重新規(guī)劃。
舉個真實場景:用戶說「我渴了」,機器人理解意圖后,規(guī)劃去最近的零食貨架找飲料,但到了貨架一看發(fā)現(xiàn)沒貨,傳統(tǒng)機器人可能就傻眼了,宣告任務失敗。
但Claw支持下的途途會怎么做?
Self-Reflector確認「零食貨架無可樂庫存」后,會生成反饋:「目標位置無目標物體,建議嘗試自動售貨機。」
規(guī)劃器接收反饋,重新規(guī)劃路徑,機器人轉(zhuǎn)向自動售貨機,最終在售貨機前精準鎖定一瓶可樂,任務圓滿完成。
這種類人的「嘗試-判斷-調(diào)整」循環(huán),是處理真實世界長尾分布(Edge Cases)的關(guān)鍵,也是它比傳統(tǒng)機器人更「聰明」的原因。
現(xiàn)在,機器人就可以輕松完成訪客接待這種長程任務了。
讓機器人融入人類社會
還有一個容易被忽視但極其重要的點:社會規(guī)范。
機器人要在人類社會中活動,不能只顧著完成任務。
電梯里人多,它要知道讓一讓;人行道上有老人,它要知道繞道走;進了咖啡店,它不能橫沖直撞嚇到顧客。
ABot-Claw引入強化學習相關(guān)技術(shù),通過多智能體相對評估,讓機器人自主學習電梯避讓、行人禮讓等社會規(guī)范。
高德還發(fā)布了SocialNav社會化導航基座模型,專門訓練機器人在人群密集環(huán)境中的社交導航能力——這項成果以6/6/5幾乎滿分的成績?nèi)脒xCVPR 2026 Oral,斷層式領先全行業(yè)。
![]()
機器人不僅要「能干活」,還要「會做人」——這是具身智能從實驗室走向真實社會的必經(jīng)之路。
Harness鋪就AGI標準航線
說完技術(shù)細節(jié),讓我們跳出來看看更大的圖景。
ABot-Claw不僅僅是一個讓機器人更好用的系統(tǒng)——它實際上定義了具身智能走向通用人工智能(AGI)的底層架構(gòu)形態(tài)。
通用性躍遷:終結(jié)定制化部署依賴
過去,每一類機器人應用場景都需要定制化部署。
家庭服務機器人一套系統(tǒng),物流配送機器人一套系統(tǒng),城市巡檢機器人又是一套系統(tǒng)。
開發(fā)成本高、迭代周期長、經(jīng)驗無法復用。
ABot-Claw改變了這一切。
通過統(tǒng)一的技能抽象和共享的空間記憶,Claw讓ABot-M0(操作模型)和ABot-N0(導航模型)的能力得以跨場景、跨形態(tài)復用。
同一個「大腦」,可以驅(qū)動四足機器人在戶外巡檢,也可以驅(qū)動機械臂在倉庫分揀,還可以驅(qū)動輪式機器人在商場導購。
這意味著機器人廠商不再需要為每個場景從零開發(fā),而是可以基于Claw提供的「即插即用」智能基座快速適配;意味著一個場景積累的經(jīng)驗可以遷移到其他場景,形成正向飛輪。
高德官方稱之為「通用大腦+專用軀體」的產(chǎn)業(yè)標準形態(tài)。
大腦是通用的,可以不斷升級迭代;軀體是專用的,適配不同場景需求。兩者解耦,各自演進,就能讓效率最大化。
從「單體工具」到「通用智能體」,Harness達成AGI標準航線
ABot體系的強大,在于其內(nèi)部形成了一個閉環(huán)的「飛輪效應」。
![]()
ABot體系的三層架構(gòu)——DATA層(ABot-World世界模型)、MODEL層(ABot-M0/N0基座模型)、AGENT層(ABot-Claw智能體系統(tǒng)),直接形成閉環(huán)。
ABot-World生產(chǎn)海量高質(zhì)量訓練數(shù)據(jù),覆蓋室內(nèi)居家、商業(yè)空間、城市街道、工業(yè)場景等多樣化真實三維環(huán)境。
ABot-M0/N0基于這些數(shù)據(jù)訓練,獲得強大的操作與導航能力。ABot-M0在Libero-Plus基準上任務成功率達80.5%,較業(yè)界標桿Pi0提升近30%;ABot-N0在7大權(quán)威評測中全部達到SOTA。
ABot-Claw將模型能力轉(zhuǎn)化為真實任務執(zhí)行能力,途途在開放環(huán)境中持續(xù)運行。
真實運行中積累的數(shù)據(jù)——成功案例、失敗案例、邊緣情況——回流到World和記憶庫中,指導下一輪數(shù)據(jù)生成和模型訓練。
這樣循環(huán)往復下去,能力就會螺旋上升。
這就是為什么高德有底氣說,途途不只是一個產(chǎn)品發(fā)布,而是一個體系的起點。
它今天能買咖啡、送快遞、導盲帶路,明天可能就能做更復雜的事情——因為它每天都在真實世界中學習,每天都在變強。
AMAP-AI Inside:開源生態(tài)降低重復造輪子成本
并且,高德的目標不僅僅是做一臺名為「途途」的機器狗,而是成為物理世界智能化的智能基座提供者。
2026年3月31日,高德宣布全量開源ABot-M0,涵蓋數(shù)據(jù)、算法與模型三大維度。
目前規(guī)模最大的通用機器人數(shù)據(jù)集UniACT——整合超過600萬條真實操作軌跡、9500多小時訓練數(shù)據(jù)、覆蓋20多種機器人形態(tài)——對外開放;動作流形學習(AML)算法、雙流感知架構(gòu)等核心技術(shù)也一并開源。
不僅如此,近期高德團隊還開源了ABot-PhysWorld,作為world Arena的比賽基線。
![]()
顯然,就像AWS之于云計算,Android之于移動互聯(lián)網(wǎng),高德希望ABot體系成為具身智能時代的水電煤。
開源的好處是顯而易見的:降低行業(yè)重復造輪子的成本,吸引開發(fā)者在同一套「Harness語言」上共建。
當越來越多的機器人運行在同一套體系之上,共享的世界記憶就會越來越豐富,每一臺新機器人都能從群體智慧中受益。
具身智能的范式躍遷
過去兩年,具身智能賽道上演了一場瘋狂的「模型軍備競賽」。
但熱鬧背后,一個尷尬的事實浮出水面:實驗室里跑得飛起的模型,到了真實環(huán)境就頻頻拉胯。
問題出在哪?不是模型不夠強,而是從「模型能力」到「任務完成」之間,缺了一層關(guān)鍵的系統(tǒng)架構(gòu)。
就像你有一顆法拉利的發(fā)動機,卻裝在一輛自行車車架上——動力再猛也跑不起來。
ABot-Claw的出現(xiàn),標志著行業(yè)思路的根本轉(zhuǎn)向:從「卷模型」走向「卷應用」。
它解決一個更本質(zhì)的問題——如何讓機器人真正成為「社會人」?
能記住去過的地方,能理解模糊的指令,能在失敗后自我調(diào)整,能與同伴協(xié)同配合,能融入人類的社會規(guī)范。
這些能力,單靠堆參數(shù)是堆不出來的。
高德在這場范式轉(zhuǎn)換中占據(jù)了獨特位置。
長期積累的空間智能數(shù)據(jù),讓它擁有全球最豐富的空間語義資產(chǎn);日均數(shù)億次的導航請求,讓它深諳「從A到B」的全部復雜性。
當其他玩家還在從零構(gòu)建空間理解能力時,高德已經(jīng)把這些能力內(nèi)化為機器人的「先天記憶」。
更聰明的是開源策略。
ABot-體系在近期宣布全面開源,高德顯然明白,具身智能需要的是整個個行業(yè)共同努力,而高德要做的是最關(guān)鍵的體系搭建。
當越來越多的機器人運行在同一套體系之上,高德的世界記憶就會越滾越大,競爭壁壘也就越筑越高。
獨居老人的智能陪護、視障人士的導盲伙伴、風雨無阻的末端配送、安全可靠的工廠協(xié)作——這些場景不再是PPT里的愿景,而是正在落地的現(xiàn)實。
當機器人不再是孤立的工具,而是共享記憶、協(xié)同進化的智能網(wǎng)絡節(jié)點時,「幫我去隔壁買杯半糖拿鐵」的未來,真的不遠了。
而這一步,就從途途邁出的第一步開始。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.