CES 2026的特別演講中不能沒有NVIDIA黃仁勛,在正式開展前夕,NVIDIA創(chuàng)始人兼CEO黃仁勛用物理AI的故事主線描述了下一代AI的可能性。與此同時,Vera Rubin這位暗物質(zhì)研究先驅(qū)、天文學(xué)家,也終于隨著NVIDIA下一代CPU和GPU正式發(fā)布被更多人所記住。
![]()
下一代AI計算平臺Vera Rubin不僅僅是算力的再度提升,也將全面覆蓋更多商用領(lǐng)域,包括自動駕駛、機器人、醫(yī)療、通用AI。2.5噸的Vera Rubin NVL72出現(xiàn)在老黃背后那一刻,一場高度協(xié)同設(shè)計、徹底淘汰傳統(tǒng)水冷模組的最前沿AI解決方案,被提上議程。
![]()
Blackwell到Vera Rubin:6顆芯片一次更換
黃仁勛上來就給了一個大招,Blackwell的解決方案已經(jīng)走到了傳統(tǒng)計算基礎(chǔ)設(shè)施的盡頭,就換而言之,過去十年投下去的約10萬億美元傳統(tǒng)計算基礎(chǔ)設(shè)施,必須被加速計算與AI重做一遍,否則無法支撐每年10倍模型體量和5倍生成內(nèi)容的增長速度。
![]()
因此Vera Rubin的升級是一整套解決方案,包括雙芯片封裝的Rubin GPU,ARM v9 144核的Vera CPU。這樣的前提下,需要BlueField-4 DPU外掛16TB的KV-Cache,以及NVLink Switch 7提供1.8TB/s的傳輸總線,2個1.6Tbps的光收發(fā)芯片,一組效率高達(dá)94%的DC/DC電源模組,主打一個猛上加猛,一整套解決方案安裝到整機也冷的NVL72機組上,重量達(dá)到2.5噸。
![]()
![]()
重歸重,帶來的性能飛躍也是非常直接的。相比上一代Blackwell,Rubin的NVFP4推理性能提升5倍,訓(xùn)練性能提升3.5倍,HBM4內(nèi)存帶寬提升2.8倍,NVLink互連帶寬翻倍,生成token成本降至現(xiàn)在的1/10。
![]()
![]()
![]()
例如運行相同70B參數(shù)MoE模型的時候,Blackwell生成2048 token需要1.8秒,彈道了Rubin僅需要0.35秒,并且能耗降低60%。
另外,在BlueField-4 DPU的加持下,KV-Cache可以幫助GPU顯存卸載到機架共享的內(nèi)存池上,每顆GPU都可以額外擴展16TB高速內(nèi)存,從而實現(xiàn)近乎無限的長對話、長視頻理解。
![]()
![]()
新硬件搭配全新的NVFP4下還能更進(jìn)一步,NVFP4可以保持>99.2%精度的前提下,把每次推理的位寬砍半,同時顯存帶寬需求減半,進(jìn)而實現(xiàn)成本降到上一代1/10。黃仁勛在演講上表示,模型大小年增長10倍,生成內(nèi)容年增長5倍,而用戶愿意為每token支付的費用年降10倍,因此只有靠全棧協(xié)同設(shè)計才能活下去。
![]()
目前Vera Rubin已經(jīng)在臺積電N3產(chǎn)線流片,計劃在2026Q2規(guī)模出貨,戴爾、HPE、聯(lián)想、Supermicro等OEM會在2026年下半年開始整機交付,從而啟動新一輪的AI算力迭代。
![]()
物理AI近在咫尺
AI加速的意義已經(jīng)在現(xiàn)實中被得以展現(xiàn),當(dāng)2個BDXdroids走上演講臺就是最直接的證明。現(xiàn)在的AI已經(jīng)跑通了從虛擬到物理、再由物理回饋虛擬AI的閉環(huán),通過訓(xùn)練、仿真、部署的路徑加速物理AI的可行性。
![]()
![]()
![]()
而這整個過程也已經(jīng)由NVIDIA跑通,先使用DGX進(jìn)行訓(xùn)練,然后通過Omniverse、Cosmos在孿生世界進(jìn)行仿真,最后通過AGX、Orin展開機器人部署,一氣呵成。
![]()
更重要的是,NVIDIA在現(xiàn)場宣布三大物理AI支柱已經(jīng)開源,Cosmos World基礎(chǔ)模型可以完成視頻到動作的聯(lián)合訓(xùn)練,GROOT 1.6人形機器人推理模型提供32自由度協(xié)調(diào),Isaac Lab Arena仿真安全測試框架包含了50萬條機器人軌跡基準(zhǔn)。這套為了賣更多GPU而打造免費軟件生態(tài)的形式在GeForce消費端屢試不爽,大多數(shù)時候NVIDIA提供的軟件生態(tài)不僅免費,用起來還挺高效,很快就會讓人欲罷不能。
![]()
![]()
物理AI當(dāng)然不會僅限制在機器人。黃仁勛在現(xiàn)場正式發(fā)布了自動駕駛智能體Alpamayo,這是一個會思考的自動駕駛,現(xiàn)場的DEMO視頻演示了一段搭載Alpamayo的自動駕駛系統(tǒng)由馳騁在舊金山,從傍晚的夕陽落日到華燈初上,這套自動駕駛系統(tǒng)很好的規(guī)避了所有可能出現(xiàn)的意外狀況,并且一邊開車一邊用自然語言解釋駕駛邏輯,比如前方施工時,如何做出一個類似人類的自然判斷,進(jìn)而給出合理解決方案。
![]()
![]()
![]()
在發(fā)布Alpamayo的同時,NVIDIA也同步宣布Alpamayo R1模型開源,提供權(quán)重、數(shù)據(jù)集、訓(xùn)練腳本、CarSim/CarMaker接口,2025款梅賽德斯奔馳CLA已經(jīng)展開測試,并將在北美地展開OTA推送。
![]()
![]()
在Alpamayo R1開源的同時,NVIDIA還放出了多個開源模型,包括蛋白質(zhì)復(fù)合體結(jié)構(gòu)預(yù)測的OpenFold3,多蛋白相互作用生成預(yù)測的Evolve2,兩公里內(nèi)的氣象模擬模型Eath-2,12小時化學(xué)污染擴散模型ForecastNet-Chem。10T token多模態(tài)開源數(shù)據(jù)集中包含了45.5萬蛋白質(zhì)結(jié)構(gòu)、100TB車載傳感器數(shù)據(jù),鼓勵學(xué)術(shù)機構(gòu)自由下載。
![]()
AI生態(tài)的開源進(jìn)階時
黃仁勛在現(xiàn)場強烈表揚了AI的開源生態(tài)。在2024年,開源AI落后閉源AI有18個月的差距,在2026年的現(xiàn)在,這個差距只剩6個月,來自中國的DeepSeek-R1、Qwen2.5、Kimi k1.5為開源AI創(chuàng)造出了無數(shù)可能。
![]()
當(dāng)開源與閉源無限接近,黃仁勛表示,任何企業(yè)和個人都有機會推動AI從語言理解的拐點,轉(zhuǎn)向理解物理的拐點,NVIDIA也將從數(shù)據(jù)中心AI公司,變成物理世界AI基礎(chǔ)設(shè)施的公司。
![]()
![]()
無論如何,NVIDIA都在扮演制造工具的角色,從最初制造游戲運行的工具,到現(xiàn)在制造AI加速的工具,推動一個生態(tài)往更廣闊的領(lǐng)域發(fā)展。有意思的是,在近幾十年中,AI概念被嘗試和熱捧了數(shù)次,而只有這一次AI的火把終于被完全點燃,成功從虛擬世界走向現(xiàn)實的物理世界,成為人類文明進(jìn)程中的一個全新注腳,這一刻的星光閃耀時,無論是NVIDIA還是無數(shù)研究AI領(lǐng)域的工作者們,都值得稱贊。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.