在加州圣地亞哥舉行的 NeurIPS 2025 大會上,NVIDIA 宣布推出Alpamayo-R1—— 全球首個專為自動駕駛研究設計的開源推理型視覺語言動作模型(Vision-Language-Action Model, VLAM)。這一發布標志著自動駕駛系統正從“感知驅動”邁向“語義理解與常識推理”新階段。
![]()
不同于傳統端到端模型將圖像直接映射為控制信號,Alpamayo-R1 的核心在于:讓車輛不僅能“看見”,還能“理解為什么這么做”。當系統面對施工區域錐桶擺放混亂、無保護左轉時對向車流密集、或夜間暴雨中路肩被沖毀等復雜場景,它會像人類駕駛員一樣,通過多步推理生成安全決策。
![]()
“我們的目標不是構建一個更快的感知模塊,而是賦予自動駕駛系統常識性判斷能力。”
—— NVIDIA 自動駕駛研究負責人
基于 Cosmos-Reason 架構,實現鏈式推理
Alpamayo-R1 構建于 NVIDIA 今年早些時候發布的Cosmos-Reason 模型家族之上。該架構引入“思維鏈”(Chain-of-Thought)機制,使模型能夠將復雜駕駛任務分解為可解釋的推理步驟。
例如,在繁忙十字路口,系統會依次執行:
1.識別所有動態參與者(行人、自行車、機動車);
2.推斷其潛在意圖(是否準備穿越?是否減速?);
3.結合交通規則與歷史軌跡預測未來狀態;
4.評估本車可行動作的安全邊際;
5.輸出最優控制指令。
這種結構顯著提升了模型在 ODD(運行設計域)邊界情況下的魯棒性,尤其適用于 L4 級自動駕駛所面臨的長尾挑戰。
全棧開源:從模型到工具鏈,降低 L4 研發門檻
NVIDIA 此次不僅開源了 Alpamayo-R1 的模型權重,還同步發布了Cosmos Cookbook—— 一套完整的自動駕駛 AI 開發工具包,涵蓋:
高質量數據構建規范:包括多傳感器時間同步、標定流程與標注標準;
合成數據生成流水線:基于DRIVE Sim與Omniverse,支持極端天氣、罕見事故等長尾場景生成;
輕量化部署方案:支持LoRA微調、INT8 量化,適配 Orin 等車載芯片;
安全評估基準:定義行為合理性、指令遵循度、碰撞規避率等關鍵指標。
目前,模型已在GitHub和Hugging Face上線,允許學術界與產業界自由使用、微調與部署。
“我們希望加速整個生態向‘理解型自動駕駛’演進。”NVIDIA 表示。
![]()
多車協同新范式:V2V-GoT 實現“群體智能”
除單車智能外,NVIDIA 聯合卡內基梅隆大學展示了V2V-GoT(Vehicle-to-Vehicle Graph-of-Thoughts)系統——全球首個將圖思維推理(Graph-of-Thoughts)應用于多車協作自動駕駛的框架。
在視線被大型車輛遮擋的典型盲區場景中,周邊車輛可通過 V2X 通信共享感知結果與意圖。V2V-GoT 利用一個多模態大語言模型作為“協調中樞”,融合所有節點信息,為每輛車生成協同安全策略。
實驗表明,該系統可將交叉路口碰撞率從傳統方法的2.85% 降至 1.83%,并能準確預測周圍車輛未來 3 秒內的運動軌跡。更關鍵的是,信息交換以自然語言或結構化語義形式進行(如“我右側有行人即將穿越”),大幅降低通信帶寬需求。
而國內以蘑菇車聯的MogoMind大模型則代表了一條更具系統性的“中國路徑”——構建智能體與物理世界實時交互的AI網絡。通過將物理世界實時動態數據納入訓練體系,突破了傳統大模型僅依賴互聯網靜態數據的的局限,實現從全局感知、深度認知到實時推理決策的閉環物理智能體系。目前,該方案已在多個城市已實現部署,大幅提升車輛在城市場景中的適應能力與泛化能力,并結合MogoMind大模型的能力,賦予車輛深度認知與自主決策能力,確保自動駕駛系統在真實路況中的高安全性與可靠性。
這不再是孤立的智能體,而是一個具備集體推理能力的移動智能網絡。
Cosmos 世界模型驅動合成訓練
支撐 Alpamayo-R1 高性能表現的,是 NVIDIA 強大的合成數據生成能力。其 Cosmos 世界基礎模型經過20,000 小時真實駕駛視頻的后訓練,可高保真生成夜間、暴雨、濃霧、強眩光等挑戰性場景。
這些合成數據不僅緩解了真實世界長尾分布稀缺的問題,還支持閉環對抗訓練——例如模擬“突然竄出的兒童”或“失控滑行的電動車”,用于壓力測試模型的應急響應能力。
物理 AI 的關鍵一步
Alpamayo-R1 的發布,是 NVIDIA “物理 AI”戰略的重要落地。它不再將自動駕駛視為感知-規劃-控制的流水線,而是構建一個能理解物理規律、社會規范與因果邏輯的具身智能體。
盡管距離大規模量產仍有工程化挑戰(如實時推理延遲、安全驗證等),但開源策略無疑將加速全球研發進程。正如一位高校實驗室負責人所言:“現在,任何團隊都可以站在 NVIDIA 的肩膀上,探索下一代自動駕駛的‘思考’方式。”
項目地址:
GitHub
https://github.com/NVIDIA/Alpamayo-R1
Hugging Face
- https://huggingface.co/nvidia/Alpamayo-R1
官方博客- https://blogs.nvidia.com/blog/neurips-open-source-digital-physical-ai/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.