![]()
![]()
真正的領先者,往往最清楚自己可能失去什么。
作者|蘇霍伊
編輯|王博
美國當地時間3月18日,「甲子光年」受邀參加了英偉達創始人兼CEO黃仁勛在GTC 2026舉行的媒體會。
黃仁勛大概是整個硅谷里最不怕記者提問的CEO,他不僅與全球記者談笑風生,還試圖像管理英偉達員工一樣對待記者。
現場一位記者的手機鈴聲響起,黃仁勛立刻停止回答,半開玩笑半嚴肅地說:“誰的手機,舉手。”他還進一步強調,自己沒什么特別不能容忍的事情,除了“開會時手機必須靜音,每一位英偉達員工都知道。”而在面對最后一個提問的記者時,他反復強調:“最后一個提問很重要,你要想清楚再問。”
![]()
GTC 2026黃仁勛媒體會現場,圖片來源:「甲子光年」拍攝
近兩個小時、三十多個問題,幾乎覆蓋AI產業的每一個關鍵環節,可以說是一次“信息過載”的問答。
但如果把所有回答壓縮,會浮現出一條清晰的主線:AI正在重建計算基礎設施,而英偉達試圖成為這套新秩序的定義者。
從推理架構的分層,到AI工廠的系統整合;從開源智能體的標準爭奪,到全球供應鏈的再布局,黃仁勛給出的是一套逐漸閉環的計算版圖。
而OpenClaw(俗稱:龍蝦)為黃仁勛帶來了新的興奮點,他在媒體會上反復提及OpenClaw并一遍遍強調其重要性,如果說主題演講上CUDA 20周年是英偉達對過去的回顧,OpenClaw就是黃仁勛對未來的押注。他認為,ChatGPT是AI的拐點,因為它讓所有人都能用上通用AI;但Agent系統一直只停留在技術行業內部,大概只有25%的軟件開發者在真正使用。然后OpenClaw出現了,幾周之內就成了歷史上增長最快的開源項目。
看看各種龍蝦的token消耗量,大家都會明白黃仁勛極力推薦OpenClaw的目的。
當所有人都在算token成本時,英偉達更在意的是——誰來定義這些token從哪里產生,誰又在引導token的消費。而真正的領先者,往往最清楚自己可能失去什么。
「甲子光年」從這次媒體會上黃仁勛的回答中精選了五句話,分別是:
“英偉達不只造GPU,實際上在構建更遠大的東西。”
“每個token都不是等價的。”
“OpenClaw是一件非常重要的事。”
“從很多層面來說,我們掌握著先手信息。”
“別被開除,別變得無聊,別死。(Don't get fired, don't get bored and don't die.)”
1.AI推理變革
媒體會上第一個問題就直指AI推理和新發布的NVIDIA Groq 3 LPU。
黃仁勛笑著對記者說:“你正看著推理之王(Inference King)。”
![]()
黃仁勛回答記者提問,圖片來源:「甲子光年」拍攝
隨后他把時間線往回拉了兩年,表示英偉達從芯片精度、架構到系統互聯,已經圍繞推理做了好幾代產品的準備。他反復強調“推理是一個巨大的計算機系統問題”,關鍵在于誰能夠打通從芯片、互聯到數據中心的整套體系。
這背后是一個更關鍵的判斷:推理競爭,已經從單點性能競爭,轉向系統級工程能力的競爭。
這也解釋了英偉達為什么要通過“技術授權+人才吸納+資產收購”的組合方式,把LPU芯片廠商Groq的核心能力“納入體系”。
黃仁勛承認Groq在推理速度上“能打”,但現實世界的推理需求,從來不是單一維度:既要低延遲,也要支持大模型,還要承載長上下文。
單一架構無法同時滿足這些需求,所以有了Groq與Vera Rubin的組合。
GTC上新發布的NVIDIA Groq 3 LPU,采用約500MB片上SRAM,并提供高達150TB/s的片上帶寬,遠高于傳統依賴外部HBM內存的GPU架構,從而顯著降低數據訪問延遲。同時,其FP8算力達到約1.2 PFLOPs,晶體管規模達980億,體現出較強的計算能力與集成度。
相比單純追求算力規模,Groq 3 LPU更強調通過大容量片上存儲與超高帶寬的數據流架構,將數據“留在芯片內”高速流動,從根本上優化大模型推理過程中最關鍵的延遲瓶頸。
![]()
GTC現場展示的NVIDIA Groq 3 LPU,黃仁勛簽名并寫下“Groq超快”,圖片來源:「甲子光年」拍攝
“我希望Groq的加入能讓大家注意到,英偉達不只造GPU,實際上在構建更遠大的東西。”黃仁勛說。
Groq加入英偉達體系后,外界也很關心黃仁勛對其的定位。
在他的規劃中,一座算力工廠75%仍將是純Vera Rubin部署,Groq與Vera Rubin的組合只占25%。Vera Rubin才是核心,Groq是側翼。
他對自家產品很自信:“它實在太強了,我們自己都不知道如何超越Vera Rubin,否則我們早就造出能勝過它的產品了。”
在黃仁勛看來,就目前token的主流消耗場景而言,Grace Blackwell和即將到來的Vera Rubin已經無可匹敵,Groq的加入改變的是版圖的邊界,而不是版圖的中心。
黃仁勛透露:“如果沒有Dynamo,我們就無法探索解耦推理的邊界,也就不會有后來收購Groq團隊的決策。”引入Groq是英偉達在推理深水區持續探索的必然結果,是Dynamo讓團隊觸及了解耦推理的技術邊界,由此看清了Groq的LPU在特定維度上的價值。
Dynamo是英偉達面向大規模AI推理而打造的軟件平臺,本質上是一個推理基礎設施編排系統(Inference Orchestration Layer)。它解決的是一個核心問題:如何把算力利用率拉到最高。
“我希望Groq之于英偉達,就如同Mellanox之于英偉達一樣,是一次架構層面的重要補充。我們構建的不是一塊GPU,而是一座AI工廠。”黃仁勛說。
2019年英偉達收購Mellanox時很多人同樣感到費解,而黃仁勛如今將那次收購視為架構補完的成功先例,用同樣的框架定位Groq,信息很清晰:他買的是AI工廠體系中一塊關鍵的架構拼圖。
2.Token定義權
如果說推理是入口,那么AI工廠才是英偉達的終極形態,而AI工廠生產的就是token。
在這場記者會上,黃仁勛多次將競爭單位從“芯片”上移到“數據中心”,可以說是“三句話離不開token”。
“我們目前是成本最低的token生產商,也是AI工廠中吞吐量最高的token生產商。”他列舉了MLPerf、SemiAnalysis和Artificial Analysis三項基準測試,稱英偉達在每一個可量化的維度上都領先。
值得注意的是,黃仁勛給出了一個判斷:“每個token都不是等價的。”
黃仁勛進一步解釋:“token可能由小型模型、較大模型或超大型模型生成,對應的輸入上下文長度也從極短到極長不等。”
在早期的大模型語境中,token幾乎被默認視為“標準化單位”——無論是API計費、推理成本,還是性能對比,大家都在用“每百萬token多少錢”來衡量。
黃仁勛試圖對token進行重新定價:token看起來一樣,但生產它們的成本結構完全不同。
為什么不同?因為一個token背后是三組變量的組合:
模型參數規模
上下文長度
推理路徑
這些變量疊加后,token的計算開銷會呈指數級分化。比如,一個簡單問答生成的token,可能只消耗極少的算力;但一個“長上下文+復雜推理鏈條”生成的token,其背后可能調用了多層模型、跨多輪推理,甚至觸發外部工具。這兩類token在“數量上相同”,但在“成本和價值上完全不等價”。
從市場角度來看,推理市場不會再是一個“統一價格曲線”,而會分成多個子市場。
一端是極致低成本、極高吞吐的“基礎token生產”(類似搜索、簡單問答);另一端是高價值、高復雜度的“智能token”(如Agent決策、多步推理)。中間還會形成大量分層場景。也正因如此,黃仁勛強調“市場不會只有一種解法”。
「甲子光年」認為,當token不再等價,競爭就不再只是“誰的計算的成本更低”,而是“誰能在不同類型token之間做最優分配”。這正是系統級能力的體現,因為其需要同時調度不同架構(GPU、LPU、DPU等)、不同精度、不同互聯方式。
以往英偉達及其競爭對手都在追求更強的芯片性能,雖然這一追求還在,但是英偉達已經開始針對不同token類型進行最優生產的算力調度體系的布局。
從產業角度看,這句話也在釋放一個信號:未來的AI競爭,不會簡單收斂為“token價格戰”,而更像是一場“算力分層與調度效率”的競爭。
誰能理解token的差異,誰才能真正參與下一階段的游戲。
作為“Token King”,英偉達自然想掌握token定義權,而OpenClaw的橫空出世,給了黃仁勛講新故事的機會。
“如今,推理的拐點已經到來,OpenClaw出現,Agent系統正在各處廣泛應用。用于推理的token生產規模才剛剛起步。”黃仁勛說。
3.反復被強調的OpenClaw
在GTC期間,黃仁勛幾乎在每一個場合都會提到OpenClaw。
![]()
GTC現場“安裝龍蝦”活動,圖片來源:「甲子光年」拍攝
在主題演講中,黃仁勛花了很長時間分享OpenClaw的作用及價值,他對OpenClaw評價極高:“OpenClaw是人類歷史上排名第一,也是最受歡迎的開源項目。”他認為,OpenClaw的意義“就像當年的Linux、HTML和Kubernetes”,甚至稱它在短短幾周內做到的事,“超過了Linux 30年做到的事”。
而在媒體會上,黃仁勛依然在強調“OpenClaw是一件非常重要的事”。
關于Agent體驗,他提到:“這種體驗僅限于企業內部,局限于科技行業,尚未向大眾開放。” 但突然之間,OpenClaw橫空出世。我們終于擁有了一個真正架構精良的開源智能體系統。”黃仁勛在媒體會上提到,Claude Code長期以來主要面向企業級應用,因此大多數人尚未真正體驗過智能體系統,“除了我們這些身處軟件開發行業的人。”
可以說,OpenClaw的出現某種程度上改變了英偉達自身的戰略姿態。
黃仁勛表示:“當OpenClaw出現,我們意識到世界終于擁有了一個開源智能體——我們現在幾乎可以將其當作一個行業標準。”
英偉達希望盡可能多地向這個開源項目貢獻能力,避免世界因此分裂成太多互不兼容的分支項目,“如果我們能將這個主項目打磨得足夠優秀,全球每家公司都能以此為起點,構建自己的智能體戰略。”
他也明確表示,英偉達將在未來30年間持續為OpenClaw注入能力,“就像我們持續向Linux和Kubernetes貢獻代碼一樣”。
與此同時,英偉達推出了NemoClaw,這并不是英偉達版的OpenClaw,而是英偉達為OpenClaw提供的企業級運行與管理軟件棧。
通過NemoClaw,開發者可以安裝NVIDIA Nemotron開源模型和OpenShell運行環境,為AI Agent提供安全隔離的執行環境,并加入數據隱私、網絡訪問和策略控制等安全機制,使長期運行的AI Agent更加可靠和可擴展。
![]()
NemoClaw,圖片來源:「甲子光年」拍攝
“基本上是一份經過英偉達優化、專為企業級場景打磨的OpenClaw藍圖。如今只需一行代碼、一鍵安裝,每個人都能獲得一個強大的智能引擎。”黃仁勛在記者會上依然在推薦NemoClaw。
這個能力延伸到物理世界同樣成立。黃仁勛提到,由于已同步攻克了認知AI,也就是AI認知領域的OpenClaw,OpenClaw在機器人內部運行已經是“相當顯而易見”的設想。采用同一推理技術的智能汽車,將帶動機器人技術在未來幾年內實現超高速演進。在數據中心層面,運行OpenClaw配合Vera Rubin整套系統,是“非常理想的組合”。
OpenClaw的影響遠不止于科技行業內部。
一位來自歐洲的記者問到了歐洲相關產業的機會,黃仁勛表示,上一次IT和軟件革命對制造業來說非常陌生。制造業的文化是嚴格的、一步一步的,每一件產品在發貨之前必須完美,因為它可能傷害到人。而軟件的運作方式是集群式的,你必須在它還沒有完善之前就發布,因為如果你不發布,它永遠不會被修復。正是這種文化差異導致美國在IT革命中全面主導,而德國卻被落在了后面。
但OpenClaw改變了這個局面。“OpenClaw不需要你去編程,它只需要你告訴它該做什么。”他想對德國、日本、瑞典等國說的話是,“你們可以跨越IT革命,直接跳躍到AI革命。將AI技術與你們世界級的機電一體化工業能力深度融合,你們將一躍成為全球機器人產業的領導者。”
還有記者問到,隨著Agent工作流的興起,新思科技、Cadence這類傳統軟件平臺將被取代?
黃仁勛回應:“請轉告散戶投資者,他們的判斷完全錯了。”
他指出這些設計工具的業務規模上限取決于有多少工程師在使用。未來會有大量AI智能體工程師,“這些智能體工程師會做什么?憑空生成晶體管嗎?不,它們會使用和人類工程師一樣的工具”,因為工作完成后,必須把結果放回人類可以理解的結構化數據中。“正因為有了智能體,我們需要授權的新思科技工具數量很可能會爆炸式增長,而不是減少。”
不過,OpenClaw面臨的挑戰同樣真實。
黃仁勛坦言:“安全并非唯一的難題,但確實是一個極其嚴峻的問題。安全、治理、隱私,以及所有與規范化智能體系統相關的特性,都是亟待解決的關鍵議題。”
「甲子光年」這幾天在GTC現場感受到,雖然OpenClaw很火,但黃仁勛的行為已經超過了對一個開源項目的常規背書,他更像是在反復確立一個新的行業共識。
在他的表述中,OpenClaw的重要性至少體現在三個層面:它讓原本只屬于少數開發者的Agent能力,開始走向更廣泛人群;它具備成為“類似Linux、Kubernetes”的行業標準的潛力;更重要的是,它正在從軟件系統延伸到機器人、自動駕駛和制造業,成為一種新的交互范式。
但如果把這些表述拼在一起看,會發現一個更深層的意圖。
在推理和“AI工廠”的敘事之外,OpenClaw實際上補上了英偉達在上層生態中的關鍵一環——不僅關心token如何被生產,也開始介入token如何被消費。
某種程度上,這是一場關于“入口”的爭奪。
誰定義了Agent系統,誰就定義了未來計算的調用方式;而誰定義了調用方式,誰就掌握了算力需求的流向。
也正因此,黃仁勛才會在不同場合反復強調OpenClaw。
4.站在產業鏈更上游
當算力變成資產,英偉達就不再只是賣鏟子的人,而開始參與礦的建造。
黃仁勛在媒體會上提到,英偉達越來越多地被要求為客戶的數據中心建設提供融資支持。他的回應很直接:“我們會向那些我們確信會成功的公司提供資助。”
這一變化,表面上是銷售模式的延伸,本質上卻是AI算力正在走向基礎設施資產化的體現。
在傳統IT時代,服務器是成本;而在AI時代,算力正在成為一種可以持續產出現金流的“產能”。一個1GW級別的數據中心,其投資規模、回收周期與運營方式,已經更接近發電廠而非互聯網機房。
在這種背景下,英偉達的角色也在發生變化。它不僅提供GPU和系統,還通過股權投資、供應鏈融資以及項目級支持,直接參與到算力資產的建設過程中。
他提到英偉達投資了CoreWeave、Nscale和Nebius,認為這些都是“全壘打”級別的投資。黃仁勛解釋了英偉達為什么有把握認定這些是必勝之局:“因為我們已經看到了流向它們的業務。從很多層面來說,我們掌握著先手信息。其中一些客戶就是Meta、Azure、Anthropic等巨頭。”
“所以英偉投資這些公司幫助這些'新星'做大的風險很低。”黃仁勛將英偉達定位為‘超級助推器’,對于流向它們的算力需求來說,也是一種正反饋的“服務價值”,“沒有英偉達這些公司也能完成融資,但這是我們能融入整個生態系統的方式。”
談及背后的投資邏輯,黃仁勛表示,英偉達的目光始終鎖定在兩個方向:上游供應鏈與下游合作伙伴。
向上游看,英偉達會推演未來2到5年的供應鏈需求,并提前布下先手;向下游看,則會評估未來1到5年需要怎樣的落地產能(包括土地、電力、廠房設施)以及開發者生態。
他以投資Coherent和Lumentum為例,指出這是典型的上游戰略布局。由于英偉達正隨著Spectrum-6大規模引入硅光子技術,未來幾年還會將其整合進NVLink擴展架構中,這使得未來的硅光子產能需求將遠超全球現有水平。為了確保供應鏈不掉鏈子,英偉達的手段非常靈活:“有時我們支付預付款,有時提供明確的需求預測;但如果某項關鍵技術的產能極度緊缺且未來需求巨大,我們就會選擇直接投資這家公司。”
相比之下,對Nebius的投資則屬于下游生態的押注。黃仁勛用一句話總結了他的大局觀:“我始終沿著整個技術與制造的生命周期進行全局掃描,以此為公司的持續增長做好萬全準備。”
「甲子光年」認為,英偉達掌握著訂單流與技術路線的雙重信息優勢,使其能夠在一定程度上預判算力資產的未來現金流,這正是基礎設施融資能夠成立的前提。
某種意義上,AI產業正在復制能源行業的路徑——從設備銷售,走向產能建設,再走向資產運營。而英偉達,正在嘗試站在這條鏈條的更上游。
5.人生哲學背后的焦慮
黃仁勛坦言,自己比以前更加忙碌。
他表示,英偉達如今的運轉和項目推進速度已經創下歷史新高,“說實話,我感覺自己越來越忙了,甚至比六個月前還要忙。原因就在于,工作成果的反饋更快了,項目數量的增長也更快了。”
他以日常工作為例說明了這種變化。現在員工寫好產品定義或架構文檔交給AI智能體,僅僅30分鐘后就能拿到成果;而在過去,團隊拿去開發通常需要一個月,員工在那期間可以從容地處理其他事務。“如今,那一個月已經壓縮成了30分鐘,你隨時都在關鍵路徑上。”
針對外界對AI搶走飯碗的擔憂,黃仁勛給出了截然相反的結論:“很多人說AI來了我們會失去工作。恰恰相反,事實是:PC讓我們更忙了,互聯網讓我們更忙了,移動設備也讓我們更忙了。”據此他判斷,AI將極大提升人類推進工作的速度,人們最終會承擔更多的工作量。
展望十年后的英偉達,他描繪了一幅人機協同的圖景:屆時公司將保持約7.5萬名人類員工的精簡規模,但會與750萬個全天候運轉的AI智能體并肩作戰。他提到,希望人類員工不必去硬跟智能體的工作節奏,并調侃道:“我很確定他們也跟不上。”
“每一種職業都會發生變化,有些工作會消失,有些工作則是全新的。”黃仁勛篤定地說,“世界在變,AI會改變這一切,但我相當確信,那將是一個更美好的世界。”
在媒體會的最后,黃仁勛用一種玩笑的方式,總結了他的人生哲學:“別被開除,別變得無聊,別死。”
他補充說,這三條構成一個三角,“盡量在這個三角中保持”。對應到公司層面,則是:“不要被你的客戶拋棄,不要讓公司變得無聊,不要倒閉。”黃仁勛說,“我已經把我人生的秘密都告訴你們了。”
如果把這段話放回這次GTC的語境中,它更像是一種被高度壓縮的經營邏輯。
“不要被客戶拋棄”,對應的是技術路徑的不確定性。在推理架構不斷演進、競品芯片頻繁出現的背景下,英偉達必須持續證明自己在系統層面的不可替代性,這也是它從GPU走向“AI工廠”的根本原因。
“不要變得無聊”,則指向生態與創新能力。當Agent成為新的計算接口,如果英偉達缺席這一層,它就有可能退回到“被調用的算力供應商”,這也解釋了他為何在不同場合反復強調OpenClaw。
而“不要倒閉”,則是對當下算力資本開支周期的現實回應。當數據中心投資規模逼近能源基礎設施級別,企業不僅要算性能,更要算周期、現金流與風險。
這三條是成功秘訣,也是黃仁勛的焦慮所在。
在一個仍在快速重構的計算體系中,沒有任何位置是穩固的。芯片可能被替代,架構可能被重寫,入口也可能被重新定義。
英偉達正在做的,是盡可能同時占據多個關鍵位置:在底層,它試圖定義token如何被生產;在中層,它試圖重構數據中心,打造AI工廠;在上層,它又試圖通過OpenClaw影響token如何被消費。
但正因如此,黃仁勛也比任何人都更清楚,一旦失去其中任何一環,整個體系都會失去支點。
雖然英偉達目前依然是“Token King”,但“居安思危”對任何一家行業頭部企業都十分必要。
(封面圖來源:「甲子光年」拍攝)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.