一凡 發自 副駕寺
智能車參考 | 公眾號 AI4Auto
Momenta,也押注世界模型了。
就在剛剛,Momenta劇透下一代飛輪大模型R7,將世界模型引入強化學習,讓AI看懂物理世界,理解物理規律。
據說引入世界模型后,R7性能暴漲,表現驚艷,以至于上汽大眾總經理陶海龍親測R7后,直接給Momenta CEO曹旭東打電話:
- 必須我們首發
上汽大眾爭取首發R7的產品,名為ID.ERA 9X。這是上汽大眾的最新旗艦,一款車長超5.2米的全尺寸增程SUV,集成了德系機械素質和中國AI技術。
![]()
Momenta押注世界模型,劇透下一代R7大模型
在劇透世界模型前,曹旭東首先介紹了行業過去的技術瓶頸。曹旭東表示,業內此前普遍采用模仿學習范式,這種范式通過模仿人類老司機軌跡來提升模型性能,無法超越人類老司機的駕駛水平。這就像咱們在學校里亦步亦趨地跟著老師學習,當然很難超越老師。
為了打破技術瓶頸,讓AI司機有希望超越人類司機,Momenta轉向了強化學習,Momenta認為強化學習大模型有希望超越人,甚至大幅超越人,在去年推出了基于強化學習的一段式端到端大模型R6
R6能夠在開放的環境中自主探索試錯,不再只是簡單地模仿人類軌跡,而是從綜合安全、舒適和效率等多個維度考慮,從多個可能軌跡中篩選出最好的那條。
R6代表著Momenta過去的技術探索,面向未來Momenta押注了世界模型,即將推出R7強化學習世界模型
這里簡單解釋一下,關于世界模型的定義有很多種,目前大體可以分為兩類:
一類是生成世界模型,一般作為自動駕駛和具身智能的“云端訓練場”,訓練端側算法。自動駕駛行業目前基本對這條路線形成了共識,只有個別玩家還在堅持真實數據為王。
另一類是表征世界模型,代表著車端真正驅動車輛的AI算法,負責理解物理世界并進行推理。目前行業在這條路線和VLA之間存在爭論,Momenta押注的正是這條路線,與Momenta同一陣營的還有蔚來華為
![]()
為什么Momenta在此時轉向了世界模型?
曹旭東認為,物理AI時代已經到來,因此自動駕駛技術必須要擁有對于物理世界的認知能力,所以Momenta在強化學習的基礎上,引入了世界模型,讓AI能夠基于更完整的物理世界信息,做出更符合物理世界的預測和規劃。只有這樣大模型才有機會真正地理解物理規律,理解運動之間的因果關系,以及物體之間交互的潛在可能。
那為什么Momenta不選VLA?
“VLA好鋼沒用刀刃上,傳感器重要性排第三梯隊”
在發布會后,曹旭東還對話了智能車參考等媒體,在群訪中回答了很多問題,最值得關注的是兩大路線之爭
第一大路線之爭圍繞VLA和世界模型之間展開。
曹旭東從直覺和技術兩個角度,解釋了為什么Momenta不選VLA。
首先從直覺上來說,曹旭東認為雖然LLM現在什么都能干,比如會寫代碼、寫詩歌、解數學題,但這對開車來說幫助不大。類比人類司機,把車開好不需要一個人會寫代碼或者解數學題,只需要ta能理解物理世界的規律,在各種各樣的場景及時做出反應,并做出安全的預判。
而只有世界模型才具有這樣的能力,能夠學習物理規律,并且可以通過強化學習收集到大量的長尾場景,反復鍛煉“肌肉記憶”。
而從技術角度來看,曹旭東介紹稱VLA的訓練側重點與自動駕駛的需求有偏差。VLA訓練起源于LLM,底座模型的參數量一般在100B左右,然后再通過視覺和語言對齊,最后用行動去和視覺-語言組合對齊。這樣看來在VLA的訓練過程中,語義的優先級高于駕駛,很多參數也沒用于駕駛任務,“好鋼沒用在刀刃上”。總結起來就是“VLA對自動駕駛是錦上添花,很難雪中送炭”
![]()
VLA和世界模型,是軟件算法層面的爭議,而在底層硬件上,行業此前還一直存在著純視覺和多傳感器冗余(激光雷達)的爭論,但這已經是過去時了
曹旭東認為,傳感器選型的重要性只能排在第三位。前兩位是什么?
首先,Momenta最重視的是算法架構、數據和體系能力
數據不必多說,這是AI迭代的基石。先說算法架構,曹旭東表示單一算法本身的壁壘很低,更重要的是架構,即把很多算法整合形成合力,并長期積累的能力。
再往上層是研發體系能力,要像神經網絡一樣可以反向傳播,就是識別到用戶高價值的任務,并將其傳播給產品和研發團隊。這樣團隊才能知道什么事情產出最高,在方案選型時選出提升用戶體驗最快的方案。
曹旭東透露,數據、架構和體系能力是Momenta內部第一梯隊重要的事情,而緊隨其后的是芯片算力。因為芯片算力直接決定模型能力上限。
在這些要素之后,排在第三梯隊的是傳感器。曹旭東認為哪怕只用純視覺,即傳感器都用攝像頭,相比人類雙眼已經是“超配”了。因為人的雙眼并不是360°環視的,攝像頭的覆蓋程度已經非常全面,有足夠的冗余。
所以傳感器當然是越多越好,但隨著數據、算法架構和研發體系能力提升,堆傳感器數量、堆激光雷達的邊際效應會減弱。
“這已經逐漸成為行業共識了”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.