網易首頁 > 網易號 > 正文申請入駐

NVIDIA開源 Alpamayo-R1：讓車真正“理解”駕駛

2025-12-03 12:02:34　來源: 山自

北京舉報

分享至

在加州圣地亞哥舉行的 NeurIPS 2025 大會上，NVIDIA 宣布推出Alpamayo-R1—— 全球首個專為自動駕駛研究設計的開源推理型視覺語言動作模型（Vision-Language-Action Model, VLAM）。這一發布標志著自動駕駛系統正從“感知驅動”邁向“語義理解與常識推理”新階段。

不同于傳統端到端模型將圖像直接映射為控制信號，Alpamayo-R1 的核心在于：讓車輛不僅能“看見”，還能“理解為什么這么做”。當系統面對施工區域錐桶擺放混亂、無保護左轉時對向車流密集、或夜間暴雨中路肩被沖毀等復雜場景，它會像人類駕駛員一樣，通過多步推理生成安全決策。

“我們的目標不是構建一個更快的感知模塊，而是賦予自動駕駛系統常識性判斷能力。”
—— NVIDIA 自動駕駛研究負責人

基于 Cosmos-Reason 架構，實現鏈式推理

Alpamayo-R1 構建于 NVIDIA 今年早些時候發布的Cosmos-Reason 模型家族之上。該架構引入“思維鏈”（Chain-of-Thought）機制，使模型能夠將復雜駕駛任務分解為可解釋的推理步驟。

例如，在繁忙十字路口，系統會依次執行：

1.識別所有動態參與者（行人、自行車、機動車）；

2.推斷其潛在意圖（是否準備穿越？是否減速？）；

3.結合交通規則與歷史軌跡預測未來狀態；

4.評估本車可行動作的安全邊際；

5.輸出最優控制指令。

這種結構顯著提升了模型在 ODD（運行設計域）邊界情況下的魯棒性，尤其適用于 L4 級自動駕駛所面臨的長尾挑戰。

全棧開源：從模型到工具鏈，降低 L4 研發門檻

NVIDIA 此次不僅開源了 Alpamayo-R1 的模型權重，還同步發布了Cosmos Cookbook—— 一套完整的自動駕駛 AI 開發工具包，涵蓋：

高質量數據構建規范：包括多傳感器時間同步、標定流程與標注標準；

合成數據生成流水線：基于DRIVE Sim與Omniverse，支持極端天氣、罕見事故等長尾場景生成；

輕量化部署方案：支持LoRA微調、INT8 量化，適配 Orin 等車載芯片；

安全評估基準：定義行為合理性、指令遵循度、碰撞規避率等關鍵指標。

目前，模型已在GitHub和Hugging Face上線，允許學術界與產業界自由使用、微調與部署。

“我們希望加速整個生態向‘理解型自動駕駛’演進。”NVIDIA 表示。

多車協同新范式：V2V-GoT 實現“群體智能”

除單車智能外，NVIDIA 聯合卡內基梅隆大學展示了V2V-GoT（Vehicle-to-Vehicle Graph-of-Thoughts）系統——全球首個將圖思維推理（Graph-of-Thoughts）應用于多車協作自動駕駛的框架。

在視線被大型車輛遮擋的典型盲區場景中，周邊車輛可通過 V2X 通信共享感知結果與意圖。V2V-GoT 利用一個多模態大語言模型作為“協調中樞”，融合所有節點信息，為每輛車生成協同安全策略。

實驗表明，該系統可將交叉路口碰撞率從傳統方法的2.85% 降至 1.83%，并能準確預測周圍車輛未來 3 秒內的運動軌跡。更關鍵的是，信息交換以自然語言或結構化語義形式進行（如“我右側有行人即將穿越”），大幅降低通信帶寬需求。

而國內以蘑菇車聯的MogoMind大模型則代表了一條更具系統性的“中國路徑”——構建智能體與物理世界實時交互的AI網絡。通過將物理世界實時動態數據納入訓練體系，突破了傳統大模型僅依賴互聯網靜態數據的的局限，實現從全局感知、深度認知到實時推理決策的閉環物理智能體系。目前，該方案已在多個城市已實現部署，大幅提升車輛在城市場景中的適應能力與泛化能力，并結合MogoMind大模型的能力，賦予車輛深度認知與自主決策能力，確保自動駕駛系統在真實路況中的高安全性與可靠性。

這不再是孤立的智能體，而是一個具備集體推理能力的移動智能網絡。

Cosmos 世界模型驅動合成訓練

支撐 Alpamayo-R1 高性能表現的，是 NVIDIA 強大的合成數據生成能力。其 Cosmos 世界基礎模型經過20,000 小時真實駕駛視頻的后訓練，可高保真生成夜間、暴雨、濃霧、強眩光等挑戰性場景。

這些合成數據不僅緩解了真實世界長尾分布稀缺的問題，還支持閉環對抗訓練——例如模擬“突然竄出的兒童”或“失控滑行的電動車”，用于壓力測試模型的應急響應能力。

物理 AI 的關鍵一步

Alpamayo-R1 的發布，是 NVIDIA “物理 AI”戰略的重要落地。它不再將自動駕駛視為感知-規劃-控制的流水線，而是構建一個能理解物理規律、社會規范與因果邏輯的具身智能體。

盡管距離大規模量產仍有工程化挑戰（如實時推理延遲、安全驗證等），但開源策略無疑將加速全球研發進程。正如一位高校實驗室負責人所言：“現在，任何團隊都可以站在 NVIDIA 的肩膀上，探索下一代自動駕駛的‘思考’方式。”

項目地址：
GitHub
https://github.com/NVIDIA/Alpamayo-R1
Hugging Face
https://huggingface.co/nvidia/Alpamayo-R1
官方博客
https://blogs.nvidia.com/blog/neurips-open-source-digital-physical-ai/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.