337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

英偉達不想只賣芯片了

0
分享至


本文來自微信公眾號:字母AI,作者:苗正,原文標題:《瞄準1萬億美元,黃仁勛把產品從芯片一路鋪到太空》,題圖來自:視覺中國

黃仁勛又站上了圣何塞SAP中心的舞臺。這一次的GTC keynote,他用了將近兩個小時,把英偉達的野心從芯片一路鋪到外太空。

表面上看,這是一場產品發布會。


Vera Rubin平臺正式亮相,七顆芯片全部投產; 收購Groq,其產品首次以“Groq 3 LPX”的身份嵌入英偉達的推理體系; 自研CPU Vera問世,專為agent而設計; 發布DLSS 5,把神經渲染帶進游戲畫面; 基于爆火的OpenClaw,推出了英偉達自家的NemoClaw; 拉來Mistral、Perplexity、Cursor等一眾AI公司,組建Nemotron開源模型聯盟; 自動駕駛方面,比亞迪、吉利、日產、五十鈴接入英偉達的DRIVE Hyperion平臺,Uber宣布2028年前在28個城市部署英偉達全棧自動駕駛車隊; 機器人基礎模型GR00T N2亮相; 甚至還有太空計劃,英偉達也要把算力送上軌道。

但黃仁勛真正想傳達的信息,比任何一款產品都大。

他給出了一個數字:從2025年到2027年,AI芯片的營收將要超過1萬億美元。

黃仁勛說,在AI時代,token是新的貨幣,AI工廠是生產它們的基礎設施。

接下來,黃仁勛先講訓練,再講推理,然后是智能體、物理 AI、機器人、自動駕駛,層層遞進。

每一層都對應更大的基礎設施需求,而如今的英偉達,每一層都有產品可以賣。

這場keynote看下來不像是一份產品報告,更像一張帝國版圖。

Vera Rubin:七顆芯片,一臺超級計算機

Vera Rubin是這場發布會的核心硬件。它由七顆芯片組成:Vera CPU、Rubin GPU、NVLink 6交換芯片、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6以太網交換芯片,以及新整合的Groq 3 LPU。

這七顆芯片全部投產,設計目標是組成一臺協同工作的超級計算機,從大規模預訓練、后訓練、測試時推理擴展,到實時的agent推理,這一臺機器就可以覆蓋AI的所有流程。


核心產品是Vera Rubin NVL72機架,集成72顆Rubin GPU和36顆Vera CPU,通過NVLink 6互聯。

黃仁勛稱,相比上一代Blackwell平臺,NVL72訓練大型混合專家模型所需的GPU數量減少到四分之一,推理吞吐量每瓦提升10倍,每token成本降至十分之一。

黃仁勛說,agent的拐點已經到來,Vera Rubin正在開啟歷史上最大規模的基礎設施建設。

同時黃仁勛還預告了Vera Rubin之后的下一代架構Kyber,采用垂直插入的計算托盤設計以提升密度和降低延遲,將搭載在2027年出貨的Vera Rubin Ultra上。

Groq LPU 登場

訓練是英偉達發家之本,但推理才是接下來真正的戰場。

因為訓練只是一次性的重活,推理才是永不停歇的日常。

每一次你向AI提問、每一次你讓AI幫你寫代碼,背后都是推理在運轉。

黃仁勛提出的方案是把推理拆成兩個階段,分別用不同的芯片來處理。

大語言模型的推理分為兩步:prefill(預填充)和decode(解碼)。prefill階段處理你輸入的提示詞,屬于計算密集型任務,GPU擅長這個;decode階段則是逐個生成回答的token,屬于帶寬密集型任務,需要極高的內存讀取速度。

或者我們換一種方式來理解黃仁勛的話,prefill是“讀題”,decode是“寫答案”。讀題可以一目十行并行處理,寫答案只能一個字一個字往外蹦。

Groq 3 LPU就是為decode階段而生的。


LPU全稱Language Processing Unit(語言處理單元),由Groq公司開發。

這家公司由前谷歌TPU團隊成員創立,英偉達在2025年底以200億美元收購了其核心資產。

每顆Groq 3 LPU內置了500MB的SRAM(靜態隨機存取存儲器),帶寬達到150TB/s,是Rubin GPU中HBM帶寬(22TB/s)的近7倍。

SRAM可以理解為芯片內部的“超高速緩存”,容量小但速度極快,特別適合decode階段對帶寬的極端需求。

英偉達將256顆Groq 3 LPU裝進一個LPX機架,與Vera Rubin NVL72機架并排部署。Rubin GPU負責prefill的重計算,Groq LPU負責decode的高帶寬輸出。

黃仁勛說,這種組合在萬億參數模型上能實現每兆瓦推理吞吐量提升35倍。

NemoClaw

黃仁勛在臺上直接點名了Claude Code和OpenClaw,他說Claude Code和OpenClaw引起了agent的拐點。

黃仁勛夸贊OpenClaw,稱OpenClaw向所有人打開了AI的下一個前沿,成為歷史上增長最快的開源項目。Mac和Windows是個人電腦的操作系統,OpenClaw是個人AI的操作系統。這是整個行業一直在等待的時刻。


英偉達為OpenClaw推出了NemoClaw。

NemoClaw是通過NVIDIA Agent Toolkit優化過后的OpenClaw,一條命令即可完成安裝。它的核心組件是OpenShell,這是一個提供開源模型和隔離沙箱的環境,為agent加上基于策略的安全、網絡和隱私護欄。

黃仁勛說,OpenShell為OpenClaw提供了下面缺失的基礎設施層,讓agent在獲得執行權限的同時受到安全約束。

NemoClaw的模型調度采用混合架構:本地運行Nemotron等開源模型處理隱私敏感任務,通過隱私路由器(privacy router)調用云端前沿模型處理更復雜的請求。

NemoClaw可以運行在GeForce RTX的電腦和筆記本、RTX PRO工作站,以及DGX Station和DGX Spark AI超級計算機上,提供7×24小時本地計算支持。

Nemotron聯盟

英偉達也要在開源模型層上搞點動作。

Nemotron聯盟是一個全新的合作機制,首批成員包括Black Forest Labs、Cursor、LangChain、Mistral AI、Perplexity、Reflection AI、Sarvam和Thinking Machines Lab(由前 OpenAI CTO Mira Murati 創立)。

聯盟的第一個項目是由Mistral AI和英偉達聯合訓練一個基礎模型,其他成員貢獻數據、評估框架和領域專業知識。模型將在英偉達DGX Cloud上訓練,開源發布,并成為即將推出的Nemotron 4模型家族的基礎。

黃仁勛的潛臺詞就是,英偉達希望開源模型生態繁榮,因為開源模型的用戶最終需要英偉達的硬件來訓練和部署。

一個由多家AI公司共同參與的開源模型聯盟,既能對抗閉源巨頭的壟斷趨勢,也能確保英偉達的基礎設施在開源生態中保持核心地位。

自動駕駛

自動駕駛是英偉達近幾年的重點之一。

比亞迪、吉利、日產、五十鈴宣布采用英偉達DRIVE Hyperion平臺開發L4級自動駕駛車輛。

Uber宣布與英偉達擴大合作,計劃到2028年在28個城市、四個大陸部署全棧英偉達自動駕駛軟件驅動的自動駕駛車隊,首批城市是洛杉磯和舊金山灣區,2027年上半年啟動。

Bolt、Grab、Lyft 也在接入 DRIVE Hyperion。


L4級自動駕駛意味著車輛在特定條件下可以完全自主駕駛,不需要人類隨時準備接管。

目前大多數量產車上的L2級輔助駕駛仍然要求駕駛員時刻保持注意力,AI只是“輔助”;L4則是AI真正在開車,人類可以不管。

黃仁勛還借此機會發布了Alpamayo 1.5,這是一個可交互、可引導的自動駕駛推理模型,能接受視頻、自車運動歷史、導航指引和自然語言提示作為輸入,輸出帶有推理鏈的駕駛軌跡。

開發者可以通過文本提示直接調整車輛行為。

AI 工廠的數字孿生

英偉達推出了DSX Air,一個用于在軟件中模擬AI工廠的SaaS平臺。

黃仁勛前幾年提出過一個叫“數字孿生”(Digital Twin)的概念,是指在虛擬環境中創建一個與真實物理系統完全對應的數字副本。

工程師可以在這個虛擬副本上進行測試、優化和故障排查,而不需要碰真實的硬件。

就像你搬新家之前,先在3D軟件里把家具擺一遍,看看哪里不合適。

只不過這里“搬”的是一整座超大規模AI數據中心。


DSX Air允許客戶在硬件到貨之前,就在模擬環境中搭建完整的 AI 工廠。

計算、網絡、存儲、編排、安全,全部按照實際部署方案配置。

CoreWeave已經在使用DSX Air來模擬和驗證其AI工廠環境。

黃仁勛稱,這種方式可以將“從部署到產出第一個token”的時間從數周甚至數月縮短到幾天甚至幾小時。

配合DSX Air的是Vera Rubin DSX AI工廠參考設計和Omniverse DSX藍圖。

前者是一份關于如何設計、建造和運營 AI 工廠基礎設施的完整指南,后者則提供物理精確的數字孿生能力,用于大規模 AI 工廠的設計和仿真。

Cadence、達索系統、西門子、施耐德電氣等工業軟件巨頭都在接入這套體系。

黃仁勛還發布了DSX Max-Q動態功率分配技術,稱可在固定電力的數據中心內多部署30%的AI基礎設施。

DSX Flex軟件則讓AI工廠成為電網靈活資產,黃仁勛說可以釋放100吉瓦的閑置電網容量。

存儲也要重新發明

BlueField-4 STX是英偉達為agent設計的新存儲架構。

傳統數據中心的存儲系統提供大容量通用存儲,但缺乏agent所需的實時響應能力。

agent在實際工作中,需要跨多個步驟、工具和會話保持上下文記憶,傳統存儲的延遲會拖慢推理速度、降低GPU利用率。

STX架構的首個落地產品是CMX上下文記憶存儲平臺,它在GPU內存之外擴展了一個高性能上下文層,用于可擴展的推理和智能體系統。

黃仁勛稱,與傳統存儲相比,CMX可提供5倍的每秒token吞吐量、4倍的能效提升和2倍的數據攝取速度。

CoreWeave、Crusoe、Lambda、Mistral AI、Nebius、Oracle等計劃采用STX用于上下文記憶存儲。Dell、HPE、IBM、NetApp、VAST Data等存儲廠商正在基于STX參考設計構建下一代AI存儲基礎設施。

DLSS 5:游戲畫面的“GPT 時刻”

游戲才是英偉達的老本行。

黃仁勛在演講中提到,DLSS 5是自2018年推出實時光線追蹤以來最重大的圖形突破。

DLSS全稱Deep Learning Super Sampling(深度學習超級采樣),是英偉達用AI提升游戲畫面質量和性能的技術。

此前的版本主要通過AI放大分辨率和生成中間幀來提升幀率。DLSS 5引入了一個實時神經渲染模型,能夠為游戲畫面注入照片級真實的光照和材質效果。


簡單來說,以前的DLSS是“讓畫面更流暢”,DLSS 5是“讓畫面更真實”。

它接收游戲每一幀的顏色和運動向量作為輸入,用AI模型理解場景中的角色、頭發、布料、半透明皮膚等復雜元素,以及正面光、逆光、陰天等環境光照條件,然后生成視覺上精確的增強圖像。

Bethesda的《星空》《上古卷軸》、CAPCOM的《生化危機》、育碧的《刺客信條:影》、騰訊、網易等廠商已確認支持。

DLSS 5將于今年秋季推出。

太空計算:最后的邊疆

最后,英偉達也宣布進軍太空計算。

黃仁勛說,太空計算是最后的邊疆,現如今已經到來。

“隨著英偉達部署衛星星座、向更深的太空探索,智能必須存在于數據產生的任何地方。太空與地面系統之間的AI處理實現了實時感知、決策和自主運行,將軌道數據中心變成發現的工具,將航天器變成自主導航的系統。與我們的合作伙伴一起,我們正在將英偉達延伸到地球之外——大膽地將智能帶到它從未到達的地方。”

于是黃仁勛拿出了Space-1 Vera Rubin Module,這是一個面向軌道數據中心的計算模塊。

采用緊密集成的CPU-GPU架構和高帶寬互聯,專為尺寸、重量和功耗(SWaP)受限的太空環境設計。

黃仁勛稱,相比H100,Space-1在太空推理場景下提供25倍的AI算力提升,能夠在軌道上直接運行大語言模型和高級基礎模型,處理來自太空儀器的海量實時數據流。

配合Space-1的還有兩款已經可用的平臺:IGX Thor和Jetson Orin。

IGX Thor提供工業級耐久性和功能安全,適合任務關鍵型邊緣環境。

Jetson Orin則是超緊湊、高能效的AI推理模塊,已經部署在衛星上用于視覺、導航和傳感器數據的實時處理。

在地面端,RTX PRO 6000 Blackwell Server Edition GPU用于地理空間情報的大規模處理,英偉達稱其分析海量衛星圖像檔案的速度是傳統CPU系統的100倍。

本文來自微信公眾號:字母AI,作者:苗正

本內容由作者授權發布,觀點僅代表作者本人,不代表虎嗅立場。如對本稿件有異議或投訴,請聯系 tougao@huxiu.com。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4842734.html?f=wyxwapp

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
炸鍋!伊朗總統被逼辭職,革命衛隊徹底奪權,以色列下了盤大棋

炸鍋!伊朗總統被逼辭職,革命衛隊徹底奪權,以色列下了盤大棋

老馬拉車莫少裝
2026-03-19 10:36:42
現實版“汪汪隊大逃亡” 7只同村小狗被偷后結伴逃亡 不離不棄 跨越17公里安全回家

現實版“汪汪隊大逃亡” 7只同村小狗被偷后結伴逃亡 不離不棄 跨越17公里安全回家

閃電新聞
2026-03-20 10:13:26
殲20設計師楊偉簡歷被撤!曾是最年輕的戰機設計師,疑涉軍工腐敗

殲20設計師楊偉簡歷被撤!曾是最年輕的戰機設計師,疑涉軍工腐敗

派大星紀錄片
2026-03-19 14:01:08
4億桶戰略石油儲備開始投放市場

4億桶戰略石油儲備開始投放市場

第一財經資訊
2026-03-20 11:11:44
巴鐵又輸慘了?印媒:S400首次擊落1架梟龍,原本瞄準的是殲-10CE

巴鐵又輸慘了?印媒:S400首次擊落1架梟龍,原本瞄準的是殲-10CE

書紀文譚
2026-03-19 18:12:37
全國人大代表建議: 公務員退休年齡延長至70歲

全國人大代表建議: 公務員退休年齡延長至70歲

互聯網大觀
2026-03-19 18:51:34
決戰今晚!3月20日晚19:30!中央5套CCTV5、CCTV5+直播節目表

決戰今晚!3月20日晚19:30!中央5套CCTV5、CCTV5+直播節目表

皮皮觀天下
2026-03-20 15:45:09
“三姐妹給父親上墳被炸身亡案”家屬發聲:直播時兩次遭網友死亡威脅,警方已立案偵查

“三姐妹給父親上墳被炸身亡案”家屬發聲:直播時兩次遭網友死亡威脅,警方已立案偵查

大風新聞
2026-03-20 10:37:08
男子蹭飯260頓后續:拒拿2000賠償,正臉曝光,被同學認出已社死

男子蹭飯260頓后續:拒拿2000賠償,正臉曝光,被同學認出已社死

潮鹿逐夢
2026-03-20 11:23:13
53秒別停后車的長春路虎司機被刑事立案!等待他的是五年以下徒刑

53秒別停后車的長春路虎司機被刑事立案!等待他的是五年以下徒刑

一支破筆半支煙
2026-03-19 21:52:14
鬧大了!路虎別車事件再反轉!當事人信息遭泄露,警方再發通報!

鬧大了!路虎別車事件再反轉!當事人信息遭泄露,警方再發通報!

奇思妙想草葉君
2026-03-20 14:45:59
火箭發射 禁止駛入

火箭發射 禁止駛入

閃電新聞
2026-03-20 14:27:54
 黃仁勛:年薪50萬的工程師沒用掉25萬美元的token,我會極度恐慌

黃仁勛:年薪50萬的工程師沒用掉25萬美元的token,我會極度恐慌

頂級大佬思維
2026-03-20 11:40:46
以一敵二!“萬噸大驅”南昌艦逼退外艦 細節公布

以一敵二!“萬噸大驅”南昌艦逼退外艦 細節公布

新京報
2026-03-20 08:25:32
1982年血色使館:中國外交官唐健生為了生存殺光了所有同事

1982年血色使館:中國外交官唐健生為了生存殺光了所有同事

阿校談史
2026-03-20 11:03:27
上將被查、院士被除名,這背后釋放的信號,比你想的更不簡單

上將被查、院士被除名,這背后釋放的信號,比你想的更不簡單

李昕言溫度空間
2026-03-19 22:56:18
52歲中國女游客在泰國射擊場中彈,系工作人員因個人操作導致槍支走火!總領館:受傷情況嚴重正在治療

52歲中國女游客在泰國射擊場中彈,系工作人員因個人操作導致槍支走火!總領館:受傷情況嚴重正在治療

大象新聞
2026-03-20 14:44:08
六國發表聯合聲明:準備采取措施保障霍爾木茲海峽安全

六國發表聯合聲明:準備采取措施保障霍爾木茲海峽安全

財聯社
2026-03-19 23:54:08
馬斯克預言AI競賽格局:Google贏西方,中國贏地球,SpaceX贏太空

馬斯克預言AI競賽格局:Google贏西方,中國贏地球,SpaceX贏太空

頂級大佬思維
2026-03-20 12:17:48
擊傷F-35真兇鎖定!原來是他!

擊傷F-35真兇鎖定!原來是他!

低調看天下
2026-03-20 13:12:59
2026-03-20 18:19:00
虎嗅APP incentive-icons
虎嗅APP
個性化商業資訊與觀點交流平臺
25927文章數 687603關注度
往期回顧 全部

科技要聞

新SU7只漲4千!雷軍:真怕交車慢挨罵

頭條要聞

母親帶1歲兒子看病如廁時把娃交人照看 兒子失蹤36年

頭條要聞

母親帶1歲兒子看病如廁時把娃交人照看 兒子失蹤36年

體育要聞

6年前的一場悲劇,造就了“法國瓦爾迪”

娛樂要聞

蔡康永小S“康熙合體”,兩人擁抱落淚

財經要聞

金融法草案向社會公開征求意見

汽車要聞

何小鵬坦白局:每月3億的“慌”與通向L4的堅定

態度原創

旅游
親子
教育
公開課
軍事航空

旅游要聞

江西南豐:農旅融合采摘樂 鄉村振興添活力

親子要聞

4800 元無痛被拒,產婦硬扛 4 小時,出房將丈夫打至骨裂:誰之過

教育要聞

落實“健康第一”,北京各區這樣做③ ——

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普會晤高市早苗 把美國襲擊伊朗比作偷襲珍珠港

無障礙瀏覽 進入關懷版