follow us
AING硬跡
在 NVIDIA GTC 2026 上,Physical AI、機(jī)器人訓(xùn)練和世界模型再次成為產(chǎn)業(yè)討論的焦點(diǎn)。在主會(huì)場展位上,英偉達(dá)官方上有?個(gè)很特別的展示:迪士尼和英偉達(dá)合作的機(jī)器?“ Blue ”,正在數(shù)字世界中學(xué)習(xí)如何理解空間、規(guī)劃路徑和在復(fù)雜環(huán)境中行動(dòng)。這個(gè)空間智能技術(shù)路徑,是由深圳的一家科技公司其域創(chuàng)新提供的。隨著智能體逐步從實(shí)驗(yàn)室走向真實(shí)環(huán)境,行業(yè)開始重新面對(duì)一個(gè)更基礎(chǔ)的問題:當(dāng)AI不再只處理文本、圖像和視頻,而要進(jìn)入真實(shí)物理世界時(shí),它究竟需要什么樣的數(shù)據(jù)基礎(chǔ)和訓(xùn)練環(huán)境?
![]()
這個(gè)問題的重要性,正在迅速上升。
過去幾年,人工智能領(lǐng)域最引人注目的突破,主要集中在大模型對(duì)語言、圖像和視頻的理解與生成能力上。但對(duì)機(jī)器人、自動(dòng)駕駛、空間智能體等 Physical AI 系統(tǒng)而言,僅靠二維信息并不足以支撐其在現(xiàn)實(shí)環(huán)境中穩(wěn)定運(yùn)行。它們面對(duì)的是一個(gè)有尺度、有結(jié)構(gòu)、有遮擋、有物理約束的三維世界。對(duì)這類系統(tǒng)來說,理解真實(shí)空間,正在成為比“看懂一張圖”更重要的能力。
![]()
也正是在這樣的背景下,空間智能公司其域創(chuàng)新在 NVIDIA GTC 2026 的亮相,呈現(xiàn)出了一條值得關(guān)注的技術(shù)路徑:通過真實(shí)世界數(shù)據(jù)構(gòu)建世界模型,再將其接入仿真訓(xùn)練流程,讓 AI 在更接近真實(shí)部署環(huán)境的條件下完成訓(xùn)練與驗(yàn)證。這一路徑被概括為Real2Sim,即 Real World to Simulation。
仿真訓(xùn)練并不新穎,真正困難的是“接近真實(shí)”
在機(jī)器人和具身智能的發(fā)展過程中,仿真訓(xùn)練一直是關(guān)鍵環(huán)節(jié)。行業(yè)通常的思路是,先構(gòu)建三維環(huán)境,再讓機(jī)器人或智能體在仿真中進(jìn)行大量訓(xùn)練,最后把能力遷移到真實(shí)系統(tǒng)中。這個(gè)邏輯聽起來非常清晰,但真正落地時(shí),問題往往出現(xiàn)在訓(xùn)練環(huán)境本身。
原因在于,仿真環(huán)境與真實(shí)世界之間長期存在“仿真到現(xiàn)實(shí)差距”,也就是 sim-to-real gap。
這種差距并不只是某個(gè)單點(diǎn)問題,而是訓(xùn)練環(huán)境與真實(shí)部署環(huán)境之間的整體偏差。比如光照是否真實(shí),紋理是否足夠細(xì)致,空間尺度是否準(zhǔn)確,物體布局是否符合現(xiàn)實(shí)規(guī)律,交互邏輯是否接近真實(shí)物理?xiàng)l件。只要其中某一層出現(xiàn)明顯偏差,模型在仿真中學(xué)到的能力,遷移到現(xiàn)實(shí)環(huán)境時(shí)就可能失效。
這也是為什么,機(jī)器人行業(yè)這些年雖然高度依賴仿真,但始終沒有把“仿真問題”真正視為已經(jīng)解決。傳統(tǒng)人工建模方式可以搭建訓(xùn)練環(huán)境,但通常存在三個(gè)明顯問題:
·構(gòu)建成本高,周期長
·場景與真實(shí)部署環(huán)境存在差異
·難以持續(xù)更新,更難規(guī)模化生產(chǎn)
當(dāng) Physical AI 開始進(jìn)入真實(shí)產(chǎn)業(yè)場景,這些問題就不再只是工程細(xì)節(jié),而開始影響系統(tǒng)訓(xùn)練效率、部署效果以及產(chǎn)業(yè)化速度。
真實(shí)世界的數(shù)據(jù),正重新被重視
行業(yè)重新重視真實(shí)世界數(shù)據(jù),并不是因?yàn)椤罢鎸?shí)采集”聽起來更先進(jìn),而是因?yàn)闄C(jī)器人和具身智能系統(tǒng)正在越來越依賴高可信度的空間環(huán)境。
一個(gè)真正適合訓(xùn)練機(jī)器人策略的環(huán)境,通常至少要滿足三層要求:
·視覺真實(shí):紋理、材質(zhì)、光照、細(xì)節(jié)足夠接近現(xiàn)實(shí)
·結(jié)構(gòu)真實(shí):空間幾何、尺度關(guān)系、場景布局準(zhǔn)確
·物理真實(shí):交互方式、運(yùn)動(dòng)約束和物體關(guān)系符合現(xiàn)實(shí)規(guī)律
![]()
只有當(dāng)這三者盡可能統(tǒng)一,訓(xùn)練環(huán)境才更接近真實(shí)部署條件,模型的遷移效果才更有保障。
因此,行業(yè)關(guān)注點(diǎn)也在發(fā)生變化。過去,很多三維技術(shù)更偏向展示、可視化或內(nèi)容生成;而現(xiàn)在,越來越多三維能力開始被放進(jìn) AI 訓(xùn)練體系中重新審視。它們的價(jià)值,不再只是“做出一個(gè)逼真的三維場景”,而是“能否把真實(shí)空間變成一個(gè)可計(jì)算、可訓(xùn)練、可驗(yàn)證的世界模型”。
這正是 Real2Sim 路徑的核心意義。
Real2Sim,將真實(shí)世界送進(jìn)訓(xùn)練系統(tǒng)
在 GTC 2026 上,其域創(chuàng)新展示的 Real2Sim 方案,展示了在前幾年爆火的瓦力機(jī)器人Blue在英偉達(dá)辦公室內(nèi)自由活動(dòng)的場景。這套方案,本質(zhì)上是在回答這樣一個(gè)問題:當(dāng)智能體需要在現(xiàn)實(shí)世界中行動(dòng)時(shí),訓(xùn)練環(huán)境如何盡可能接近真實(shí)世界?
其域給出的答案是,從真實(shí)空間出發(fā),通過多模態(tài)空間感知與高保真三維重建,把現(xiàn)實(shí)環(huán)境快速數(shù)字化,再轉(zhuǎn)化為可進(jìn)入仿真平臺(tái)的空間模型,最終服務(wù)于 AI 訓(xùn)練、任務(wù)驗(yàn)證和系統(tǒng)部署。
![]()
簡化來看,這條鏈路可以被概括為:
真實(shí)空間 → 三維重建 → 世界模型 → 仿真訓(xùn)練環(huán)境
與傳統(tǒng)依賴人工建模的方式相比,這一路徑的價(jià)值主要體現(xiàn)在三個(gè)方面:
第一,訓(xùn)練環(huán)境更接近真實(shí)部署條件。
訓(xùn)練場景來自真實(shí)空間數(shù)據(jù),這意味著尺度關(guān)系、空間結(jié)構(gòu)、環(huán)境細(xì)節(jié)和物體分布都更貼近實(shí)際應(yīng)用環(huán)境,能夠縮短訓(xùn)練世界與現(xiàn)實(shí)任務(wù)之間的距離。
第二,環(huán)境可以持續(xù)更新。
如果訓(xùn)練環(huán)境建立在真實(shí)空間采集和重建流程之上,它就不是一次性靜態(tài)搭建的結(jié)果,而可以隨著現(xiàn)實(shí)環(huán)境變化不斷更新。這對(duì)于復(fù)雜工業(yè)現(xiàn)場、動(dòng)態(tài)空間和長期迭代的機(jī)器人系統(tǒng)尤其重要。
第三,有機(jī)會(huì)降低高擬真訓(xùn)練環(huán)境的生產(chǎn)成本。
過去高質(zhì)量三維場景的生產(chǎn)高度依賴人工建模,流程重、成本高、難復(fù)制。而真實(shí)采集驅(qū)動(dòng)的環(huán)境生產(chǎn)方式,則更接近一種可工程化、可規(guī)模化的基礎(chǔ)設(shè)施能力。
從這個(gè)角度看,Real2Sim 的意義并不局限于“三維重建更真實(shí)了”,而是為 Physical AI 提供了一種更接近真實(shí)世界的數(shù)據(jù)入口。
為什么是空間智能,而不是三維建模?
如果只從表面看,Real2Sim 很容易被理解為一種三維重建方案。但更準(zhǔn)確地說,它背后體現(xiàn)的是“空間智能”的能力,而不只是建模能力。
空間智能的重要性在于,它并不止步于把環(huán)境掃描出來,而是要把現(xiàn)實(shí)空間進(jìn)一步轉(zhuǎn)化為 AI 可以理解、可以推理、可以調(diào)用的模型輸入。也就是說,空間數(shù)據(jù)不再只是被“看見”,而是被納入決策、訓(xùn)練與部署體系之中。
在這條路徑上,空間智能解決的并不是一個(gè)單一問題,而是三個(gè)連續(xù)問題:
·環(huán)境感知:獲取真實(shí)環(huán)境結(jié)構(gòu)
·環(huán)境理解:構(gòu)建可計(jì)算的三維空間模型
·環(huán)境訓(xùn)練:把真實(shí)環(huán)境轉(zhuǎn)化為可用于 AI 訓(xùn)練的仿真世界
對(duì)于機(jī)器人系統(tǒng)而言,這種能力的實(shí)際價(jià)值非常明確。它可以支持導(dǎo)航與路徑規(guī)劃,支持復(fù)雜環(huán)境中的任務(wù)執(zhí)行,也可以幫助縮小仿真訓(xùn)練與現(xiàn)實(shí)部署之間的遷移差距。
這也是為什么,隨著具身智能和機(jī)器人技術(shù)的發(fā)展,空間智能開始被越來越多地視為一種基礎(chǔ)能力,而不再只是某個(gè)垂直環(huán)節(jié)中的工具。
GTC 釋放出的信號(hào):AI 訓(xùn)練正在轉(zhuǎn)向基礎(chǔ)設(shè)施競爭
相比單點(diǎn)功能演示,其域創(chuàng)新此次在 GTC 上更值得關(guān)注的地方,在于它展示的并不是一個(gè)孤立產(chǎn)品,而是一條更完整的系統(tǒng)鏈路:從真實(shí)空間采集,到三維重建,到世界模型生成,再到仿真訓(xùn)練接入,最終進(jìn)入產(chǎn)業(yè)生態(tài)平臺(tái)。
在本屆 GTC 上,其域創(chuàng)新的能力以多種形式呈現(xiàn),包括公開主題演講、機(jī)器人相關(guān)展示內(nèi)容,以及與 AWS 聯(lián)合呈現(xiàn)的 Real2Sim 方案。這種多場景集中亮相,本身就說明空間智能能力正在進(jìn)入更核心的 AI 技術(shù)討論區(qū),而不再只是邊緣性的三維展示技術(shù)。
![]()
這背后反映出的,其實(shí)是 AI 產(chǎn)業(yè)競爭重心的一次變化。
過去,大模型時(shí)代的關(guān)鍵資源是文本、圖像和視頻語料;而面向 Physical AI,新的關(guān)鍵資源正在變成高質(zhì)量、可訓(xùn)練、可計(jì)算的真實(shí)三維環(huán)境。誰能持續(xù)、規(guī)模化地生產(chǎn)這類環(huán)境,誰就更有可能在下一階段的機(jī)器人訓(xùn)練和世界模型構(gòu)建中占據(jù)優(yōu)勢。
從這個(gè)意義上說,行業(yè)正在從“模型能力競爭”,逐步走向“訓(xùn)練基礎(chǔ)設(shè)施競爭”。
如果把視角再拉高一些,GTC 2026 上這類展示釋放出的信號(hào)已經(jīng)很明確:當(dāng) AI 開始走向真實(shí)物理世界,空間智能的角色正在從“輔助工具”轉(zhuǎn)向“基礎(chǔ)設(shè)施”。
對(duì)具身智能來說,訓(xùn)練不再只是模型調(diào)參的問題,也不再只是算力和數(shù)據(jù)量的問題,而是訓(xùn)練環(huán)境本身是否足夠接近真實(shí)世界的問題。誰能更快、更穩(wěn)定、更規(guī)模化地把真實(shí)空間轉(zhuǎn)化為世界模型,誰就更有機(jī)會(huì)參與下一階段 Physical AI 的基礎(chǔ)能力建設(shè)。
其域創(chuàng)新此次在 GTC 的亮相,提供的正是這樣一種觀察窗口。它所展示的,不僅是一套面向 Real2Sim 的技術(shù)方案,更是一條由真實(shí)世界數(shù)據(jù)驅(qū)動(dòng)的空間智能路徑:讓現(xiàn)實(shí)環(huán)境進(jìn)入仿真訓(xùn)練體系,讓三維空間成為 AI 可理解、可推理、可訓(xùn)練的基礎(chǔ)輸入。
在具身智能逐步走向產(chǎn)業(yè)落地的當(dāng)下,這條路徑的重要性,正在被越來越多的人重新認(rèn)識(shí)。
AING硬跡正在打造AI硬件社區(qū),對(duì)加入社群感興趣的讀者,歡迎掃碼下方二維碼加入【AING硬跡產(chǎn)業(yè)交流群】。
AING硬跡
AING,取自“AI+ING”的縮寫,中文諧音“硬跡”,寓意著“人工智能正當(dāng)其時(shí)”,致力于追尋硬科技發(fā)展的足跡,不斷探索人工智能與智能硬件的深度融合。
未來,AING硬跡將不斷發(fā)布AI大模型技術(shù)、AI產(chǎn)業(yè)生態(tài)、AI硬件產(chǎn)品等行業(yè)資訊、發(fā)展趨勢與市場動(dòng)態(tài),我們相信大多數(shù)硬件都值得用AI重做一遍,AING硬跡期望與AI大模型廠商、與AI硬件廠商共同成長,迎接AI時(shí)代的來臨。
![]()
人工智能正當(dāng)時(shí)
一起追尋AI+硬件的足跡
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.