網易首頁 > 網易號 > 正文申請入駐

逐項解讀黃仁勛GTC演講：Vera Rubin、token王、英偉達“龍蝦”、太空計算和雪寶｜甲子光年

2026-03-17 13:29:39　來源: 甲子光年

北京舉報

分享至

AI工廠啟動，人類歷史上最大基礎設施建設正在發生。

作者｜蘇霍伊周悅

編輯｜王博

美國當地時間3月16日上午11點15分，英偉達創始人、CEO黃仁勛出現在了圣何塞SAP中心的舞臺上，開始GTC 2026的主題演講。

面對全場的歡呼聲，黃仁勛說：“我想提醒大家，這是一場科技大會?！?/p>

這里距離英偉達總部辦公室只有10分鐘車程，是每年英偉達GTC主題演講的舉辦地。雖然黃仁勛經常出現在各種場合發表演講，但是在這里，他明顯更自然、放松。

圣何塞才是黃仁勛的主場。

雖然圣何塞的酒店價格飛漲，會場周邊的酒店甚至超過了2000美元一晚，但仍有大量的參會者來到這里，希望聽到AI行業最前沿的分享，尋找更多合作機會。

“GTC已經不只是一個技術大會，而是觀察全球AI產業趨勢的重要窗口。”北大學生人工智能創新會創始理事長謝小璇Valeri告訴「甲子光年」，“這次主要是看黃仁勛會怎么定義未來一年AI行業的重點方向，尤其是算力平臺、Agent、機器人和企業級應用這些領域。”

Eigen AI聯合創始人、麻省理工學院計算機科學博士金帝則告訴「甲子光年」，他最關注的是LPU會給AI推理帶來多大的重塑。

這次，黃仁勛的主題演講主要有五項重要技術發布。

第一，下一代AI計算平臺Vera Rubin。該平臺將7款芯片整合在一起協同運行，通過5種機架組成一臺強大的AI超級計算機，能夠支持從大規模預訓練、后訓練和測試階段擴展，到實時的Agent式推理等階段的AI計算需求。

第二，下一代AI工廠參考設計Vera Rubin DSX。英偉達為企業和數據中心運營商提供一套完整指南，用于設計、建設和運營下一代AI工廠。

第三，“企業版OpenClaw”——NemoClaw。NemoClaw是英偉達為OpenClaw Agent平臺提供的企業級運行與管理軟件棧，可理解為OpenClaw的企業版運行環境。

第四，太空計算計劃。英偉達計劃將AI計算能力從地面數據中心延伸到軌道空間。通過將數據中心級計算能力部署到體積、重量和功耗受限的航天環境中，英偉達希望支持軌道數據中心、地理空間情報處理以及自主航天任務等新型應用。

第五，全新物理AI數據藍圖——NVIDIA Physical AI Data Factory Blueprint。這是一種開放參考架構，可統一并自動化訓練數據的生成、增強與評估，從而降低大規模訓練物理AI系統的成本、時間和復雜性。

「甲子光年」注意到，在今天演講中，除了“AI”一詞之外，黃仁勛說得最多的詞就是“token”：“token是新的商品”“英偉達的token成本是世界級的，無人能及”……甚至他舉起雙拳說：“古有美猴王，今有Token王。”

從前段時間黃仁勛發布“AI是一塊五層蛋糕（AI is a five-layer cake）”理論到今天GTC上的發布，可以看出，黃仁勛想要擺脫芯片公司的標簽，把英偉達打造成一家AI基礎設施公司。在他眼中，AI就是“人類歷史上規模最大的基礎設施建設”。

演講現場，圖片來源：「甲子光年」拍攝

1.揭秘Vera Rubin

去年GTC，黃仁勛就提到了Vera Rubin平臺；今年GTC，黃仁勛揭秘了Vera Rubin平臺的詳細構成。

“Vera Rubin是一次跨時代的飛躍，它是由7款突破性芯片、5種機架組成的一臺巨型超級計算機，旨在為AI的每一個階段提供動力，”黃仁勛說，“隨著Vera Rubin的推出，Agentic AI的拐點已經到來，也將引發史上規模最大的基礎設施建設浪潮?！?/p>

其中，7款芯片指的是：

NVIDIA Vera CPU
NVIDIA Rubin GPU
NVIDIA NVLink 6 交換機
NVIDIA ConnectX-9 SuperNIC
NVIDIA BlueField-4 DPU
NVIDIA Spectrum-6 以太網交換機
NVIDIA Groq 3 LPU

5種機架指的是：

Vera Rubin NVL72 GPU機架
Vera CPU機架
NVIDIA Groq 3 LPX推理加速器機架
NVIDIA BlueField-4 STX存儲機架
NVIDIA Spectrum-6 SPX 以太網機架

黃仁勛發布NVIDIA Vera Rubin，圖片來源：「甲子光年」拍攝

在這7款芯片中，最受關注的是此次新發布的Vera CPU和Groq 3 LPU。

Vera CPU是全球首款為agentic AI和強化學習專門打造的處理器，在效率上達到傳統機架級CPU的兩倍，并且速度提高了50%。目前Vera CPU已進入全面量產，并將于今年下半年向合作伙伴提供。

Vera CPU的發布意味著傳統CPU的設計路徑正在被AI重新定義。

過去，游戲CPU追求單核性能，云CPU強調多核并發，移動設備的CPU則優先能效，而三者往往難以兼得。但AI工作負載同時要求高并發、低延遲和高能效，使得CPU必須在“多核、單核性能與能效”三者之間實現平衡。

這也就是說，AI需要一款全新的CPU，它不再沿用傳統CPU的單一優化邏輯，而是面向AI工廠，成為一個融合多核擴展性、單線程性能和能效的系統級調度中樞。

Vera CPU的創新之處在于與GPU和網絡架構的深度協同。在Vera Rubin 平臺中，CPU、GPU、DPU和高速網絡被設計為一個整體系統。通過高速互聯和統一的數據流管理，Vera CPU可以更高效地協調AI推理請求、模型加載以及大規模Agent任務的執行，從而提升整個AI工廠的吞吐效率和資源利用率。

從已披露的規格來看，Vera CPU采用88核設計，支持高達1.5TB內存與1.2TB/s帶寬，并通過 NVLink實現與GPU之間高達1.8GB/s的互聯。這種帶寬和互聯能力，使CPU首次成為AI系統中的核心數據調度節點，而不再只是外圍控制單元。

“Vera CPU專為極高的單線程性能、極高的數據輸出能力、卓越的數據處理能力和極致的能效而設計。它是全球唯一一款數據中心專用中央處理器。”黃仁勛說。

而在本次GTC開幕前夕，就有媒體爆料英偉達將帶來一款“世界從未見過的芯片”。

答案也很快揭曉——Groq 3 LPU，這是一款專門用于大語言模型推理的處理器。

在大模型推理過程中，通?？梢圆鸱譃閮蓚€階段：一是Prefill（預填充）階段，即在輸入prompt后進行大規模矩陣計算；二是Decode（解碼）階段，模型按token逐步生成輸出內容。GPU在前一個階段中具備顯著優勢，但在后一個階段中，由于生成過程具有強順序性、對延遲高度敏感，且難以形成高效并行，往往導致算力利用率下降。

Groq 3 LPU就是專門為解碼階段優化。在Vera Rubin平臺中，Groq 3 LPU會與GPU協同工作。

從硬件指標來看，Groq 3 LPU采用約500MB片上SRAM，并提供高達150TB/s的片上帶寬，遠高于傳統依賴外部HBM內存的GPU架構，從而顯著降低數據訪問延遲。同時，其FP8算力達到約1.2 PFLOPs，晶體管規模達980億，體現出較強的計算能力與集成度。

Rubin GPU與Groq 3 LPU，圖片來源：「甲子光年」拍攝

相比單純追求算力規模，Groq 3 LPU更強調通過大容量片上存儲與超高帶寬的數據流架構，將數據“留在芯片內”高速流動，從根本上優化大模型推理過程中最關鍵的延遲瓶頸。

Groq此前是一家獨立的公司，成立于2016年，長期專注于AI推理基礎設施，除了LPU之外，也自建了GroqCloud推理平臺。2025年12月，英偉達與Groq達成一項非獨家推理技術授權協議，吸納部分核心成員加入英偉達，以推進相關技術規?；?。

英偉達引入Groq并推出Groq 3 LPU，本質上是為了補齊其在“推理時代”的關鍵短板。隨著 AI 從訓練轉向推理，尤其是Agent AI的興起，低延遲token生成成為核心瓶頸。英偉達構建GPU+LPU的異構推理體系，本質上是在從“訓練芯片公司”升級為“推理基礎設施公司”。

而在5種機架中，Vera Rubin NVL72機架的發布吸引了廣泛關注。

黃仁勛將Vera Rubin NVL72明確定位為新一代“AI工廠核心單元”。這一系統以機架為單位，集成72個Rubin GPU與36個Vera CPU，并通過NVLink 6、高速網絡與DPU構建統一計算架構，實現計算、存儲與數據流的深度耦合。

本質上，NVL72已不再是傳統服務器，而是一臺面向AI全流程的“整機級超級計算機”。

Vera Rubin NVL72，圖片來源：「甲子光年」拍攝

Vera Rubin NVL72單機可提供高達3600 PFLOPS推理性能，并通過NVLink 6實現260TB/s的機架級互聯帶寬，顯著降低跨GPU通信瓶頸。同時，HBM4內存容量與帶寬大幅提升，使其能夠支持更大上下文和更復雜的Agent推理任務。相比上一代架構，整體推理性能提升數倍，token成本也顯著下降。

黃仁勛介紹NVIDIA Vera Rubin NVL72，圖片來源：GTC 2026

而Vera CPU機架則是一個為AgenticAI和強化學習任務設計的CPU機架系統，單機架包含 256個Vera CPU、400TB內存、300TB/s LPDDR5x 帶寬，以及64個BlueField-4 DPU。

通過與Spectrum-X以太網網絡深度集成，Vera CPU機架可以在AI工廠內部實現多節點環境的高效同步，使強化學習與Agent系統能夠在大規模分布式環境中穩定運行。

官方數據顯示，相比傳統數據中心CPU，該系統在性能與能效上實現約2倍效率提升和50%性能提升。這一架構不僅為大規模Agentic AI 提供了基礎支撐，也標志著CPU在AI數據中心中的角色，從通用計算單元轉向“環境生成與調度引擎”。

英偉達還同步推出Groq 3 LPX推理加速器機架，專門面向大模型推理階段的低延遲需求。該機架集成了256個LPU處理器，提供高達128GB片上SRAM和640TB/s機架級帶寬。在這一架構中，大量LPU被組織為一個統一的“邏輯處理器”，以確定性數據流方式執行推理任務，使token生成過程具備更高吞吐與更低延遲。

NVIDIA Groq 3 LPX，圖片來源：「甲子光年」拍攝

這釋放出一個更加清晰的信號：在英偉達的設想里，未來的計算單元，將不只是GPU機架，而會出現GPU機架、CPU 機架、LPU機架、存儲機架、網絡機架等分工更細的模塊化組合。

黃仁勛表示，Vera Rubin的發布代表著計算能力在10年內提升了4000萬倍。至于交付情況，他提到Grace Blackwell當初因為NVLink 72的整合，早期送樣很復雜，“但Vera Rubin的送樣進展非常順利”?！?/p>

事實上，微軟的CEO薩提亞·納德拉（Satya Nadella）應該已經對外公布了，第一臺Vera Rubin已在微軟Azure上點亮運行了?！秉S仁勛說。

NVIDIA Vera Rubin，圖片來源：GTC 2026

「甲子光年」認為，Vera Rubin標志著AI計算從單一芯片競爭，邁向以整機系統為核心的“AI 工廠級基礎設施”時代。

2.建設AI工廠，成為token王

AI工廠是英偉達近兩年一直在強調的概念。

AI工廠本質上就是把數據中心重新定義成“智能產線”：輸入是電力、數據、模型和調度系統，輸出則是 token、智能體執行能力和行業場景中的實際生產率。

圍繞這一概念，英偉達發布了下一代AI工廠參考設計Vera Rubin DSX，這一參考設計覆蓋計算、網絡、存儲、電力和冷卻等整個基礎設施棧，并通過軟硬件協同設計，實現更高的token 產出效率和能源利用率。

同時，英偉達還推出 Omniverse DSX Blueprint，利用數字孿生技術對AI工廠進行高精度建模與仿真，使開發者能夠在實際建設前模擬數據中心運行、優化性能并降低部署風險。通過這一架構，英偉達希望將AI數據中心從傳統IT設施升級為“生產智能token的工廠”。

Vera Rubin DSX，圖片來源：「甲子光年」拍攝

黃仁勛在演講中稱：“英偉達正在從一家芯片公司，轉向一家AI工廠公司、AI 基礎設施公司?！?/p>

黃仁勛談AI工廠，圖片來源：「甲子光年」拍攝

在黃仁勛看來，AI時代真正重要的是誰能把整套系統做得更好，讓AI工廠以更低成本持續運行。這樣看，Rubin的意義也就不只是Blackwell的下一代，英偉達想借此定義AI工廠這套新基礎設施。

黃仁勛提出了一套更鮮明的觀點AI工廠是AI時代的工業基礎設施，推理是核心負載，Token 是新的商品，算力就是收入。這意味著，未來的數據中心不再只是堆放服務器的機房，而是生產智能的工廠。衡量這座工廠效率的關鍵，不只是算力有多強，而是能以多高效率、多少成本持續產出Token。

在今天的演講中，黃仁勛反復強調token成本，并援引SemiAnalysis的測算稱，英偉達目前在這一指標上處于世界領先位置。他還半開玩笑地說，過去大家講“美猴王（Monkey King）”，現在更值得爭奪的是“Token王（Token King）”。他稱：“我們的token成本是全球最低的。”暗示英偉達是當之無愧的“Token王”。

黃仁勛表示英偉達Token成本全球最低，揮手示意為“Token King”，圖片來源：GTC 2026

黃仁勛強調，相較上一代GPU Blackwell，Rubin將帶來更大的商業空間，并有望釋放高達1500億美元的收入。

黃仁勛展示Rubin與Blackwell收入對比，圖片來源：「甲子光年」拍攝

黃仁勛以一座1吉瓦級AI數據中心為例，將算力按免費、中端、高端和旗艦服務分層，各占25%，強調不同token服務對應不同商業價值，并以此說明AI工廠的收入結構正在發生變化。

他指出，隨著架構升級，單位功耗可產生的token數量持續提升，而token成本不斷下降，從而顯著放大整體收入空間。

在這一框架下，Blackwell相比Hopper在吞吐與效率上的提升，已帶來顯著的收入能力增長，而Vera Rubin平臺在此基礎上進一步提升系統級性能，使AI工廠的商業模型繼續向高密度、高效率演進。與此同時，通過引入GPU與LPU的異構架構，對推理流程進行分工優化，還可以進一步提升低延遲場景下的token產出效率，從而釋放更高價值的應用收入。

他建議用戶“盡快遷移到Vera Rubin”，因為token成本持續下降的同時吞吐量還在上升。如果進一步將25%的數據中心配備Groq用于高速編程類token生成，收入還能進一步提升。

NVIDIA Rubin NVL72與Blackwell NVL72推理速度及效率對比，圖片來源：「甲子光年」拍攝

“但要真正爆發，吞吐量和單token成本還需要持續優化?！盓igen AI聯合創始人金帝在GTC現場告訴「甲子光年」。

在主題演講中，黃仁勛展示了各推理服務商在Kimi K2.5 Reasoning模型上的輸出速度排名中，其中Eigen AI以439 tokens/s位列第一。“我們是一家專注于高性能、低成本的大模型訓練與推理的全?；A設施公司，感到很幸運黃仁勛Cue到了?！苯鸬壅f。

截至2026年3月14日全球領先的推理服務商，左一為Eigen AI。圖片來源：「甲子光年」拍攝

從商業視角看，這意味著英偉達的天花板正在被重新打開。一旦機架成為產品單位，英偉達可售賣的就不只是芯片本身，還包括整機、網絡、存儲、軟件棧、調度框架，乃至AI工廠的設計藍圖。對于黃仁勛來說，這比賣一代又一代GPU的故事，要大得多。

在GTC現場，GMI Cloud創始人&CEO Alex Yeh告訴「甲子光年」：“我們會開始買Vera Rubin平臺的硬件來在各國開展sovereign AI（主權AI）的AI數據中心建設?！?/p>

3.每家公司都該有自己的OpenClaw策略

黃仁勛在介紹Vera Rubin、AI工廠時，經常提到的一個詞是Agentic AI。

OpenClaw（龍蝦）在硅谷熱度不減，GTC現場經常能看到頭戴龍蝦裝飾的觀眾，甚至黃仁勛的Keynote頁面上還引用了國內社交媒體上流傳很廣的一張“龍蝦主題”線下聚會圖。

就在黃仁勛演講開始前，OpenClaw創始人彼得·斯坦伯格（Peter Steinberger）出現在了GTC的場外直播中。他表示，Agent已經徹底改變了他的日常工作方式：那些無聊的重復性任務現在全由Agent搞定，他自己已經不怎么寫代碼了，更多時間花在思考架構和方向上。

彼得·斯坦伯格做客GTC現場直播節目，圖片來源：「甲子光年」拍攝

“現在最大的挑戰反而是‘不’，因為東西太容易實現了，一句prompt就能做出來，但你還是得想清楚到底要往哪走?！彼固共穹窒?，他的Agent甚至能自動把郵件、issue tracker和各種討論線索關聯起來，讓他一眼看到該做什么，然后只專注在真正有意思的事情上。

而在演講中，黃仁勛花了很長時間分享OpenClaw的作用及價值，他對OpenClaw評價極高：“OpenClaw是人類歷史上排名第一，也是最受歡迎的開源項目?！彼J為，OpenClaw的意義“就像當年的Linux、HTML和Kubernetes”，甚至稱它在短短幾周內做到的事，“超過了Linux 30年做到的事”。

黃仁勛認為，OpenClaw不只是一個agent，而更像是“Agentic Computer的操作系統”：它能連接大模型、調用工具、訪問文件系統、執行任務調度、拆解復雜問題，還能調用子代理，通過多模態方式與人交互。

由此，黃仁勛拋出一個判斷：“現在，每一家軟件公司、每一家技術公司，都必須有自己的OpenClaw策略和Agent策略。”

“推理的拐點到來”，圖片來源：「甲子光年」拍攝

但他隨即強調，Agentic AI一旦進入企業網絡，也會帶來全新的安全問題——它可以接觸敏感信息、執行代碼、并對外通信。

為了解決這方面的問題，英偉達推出了NemoClaw。這并不是英偉達版的OpenClaw，而是英偉達為OpenClaw提供的企業級運行與管理軟件棧。

通過NemoClaw，開發者可以安裝NVIDIA Nemotron開源模型和OpenShell運行環境，為AI Agent提供安全隔離的執行環境，并加入數據隱私、網絡訪問和策略控制等安全機制，使長期運行的AI Agent更加可靠和可擴展。

NemoClaw可以在任何專用平臺上運行，包括配備NVIDIA GeForce RTX的臺式機和筆記本電腦或配備NVIDIA RTX PRO的工作站，以及NVIDIA DGX Station和 NVIDIA DGX Spark人工智能超級計算機。它可為自主化Agent提供本地計算，使其能夠全天候運行。

NemoClaw，圖片來源：「甲子光年」拍攝

“知識型工作的苦活正在被徹底轉移，有些公司已經完全理解了這一點，但有些還沒有意識到我們能做到的和實際做到的之間，差距是驚人的?！彼固共衩枋隽怂鳛殚_發者的切身體會。

圍繞這一點，黃仁勛進一步判斷：“未來每一家SaaS公司都會成為AaaS（Agentic as a Service）公司?！痹谒磥?，軟件公司未來賣的不再只是工具，而是能執行任務的“數字員工”或“專業Agent”；工程師除了工資，甚至還會擁有自己的token預算，而這些token，則將由各家的AI工廠持續生產。

果殼CEO、未來光錐前沿科技基金創始合伙人姬十三聽完黃仁勛演講后也對此感觸很深：“我這幾天在硅谷聊下來，發現OpenClaw生態已經繁榮，有人做專屬硬件，有人做更好的OpenClaw，有人做垂直行業版。2026年應該妥妥是Agent元年了?！?/p>

而英偉達的合作伙伴也做好了準備，作為首批與英偉達Dynamo合作并支持OpenShell運行時的云提供商之一，GMI Cloud的創始人&CEO Alex Yeh告訴「甲子光年」，GMI Cloud正在為NemoClaw提供基礎設施服務。

4.奔向太空，走進物理世界

這次黃仁勛的主題演講中還有兩個值得關注的發布。

太空計算計劃。英偉達計劃將AI計算能力從地面數據中心延伸到軌道空間。通過將數據中心級計算能力部署到體積、重量和功耗受限的航天環境中，英偉達希望支持軌道數據中心、地理空間情報處理以及自主航天任務等新型應用。

例如，新的Space-1 Vera Rubin Module可在太空環境中提供高性能AI推理能力，這一專為太空環境設計的AI計算模塊，搭載新一代Rubin GPU，其AI推理性能比H100高出25倍，支持在軌道上運行大型語言模型和實時數據處理。而IGX Thor和Jetson Orin平臺則為衛星和航天器提供實時AI處理與邊緣計算能力。

通過這些技術，AI可以在數據產生的地方——包括衛星、軌道設施和航天器上，直接進行分析和決策，從而減少數據回傳延遲，并推動太空基礎設施向“智能化、自主化”演進。

NVIDIA Space-1 Vera Rubin Module發布，圖片來源：GTC 2026

另外就是全新物理AI數據藍圖——NVIDIA Physical AI Data Factory Blueprint。這是一種開放參考架構，可統一并自動化訓練數據的生成、增強與評估，從而降低大規模訓練物理AI系統的成本、時間和復雜性。

通過該架構，開發者可以利用NVIDIA Cosmos開放世界基礎模型和編碼Agent，將有限的真實數據擴展為大規模、多樣化的數據集，并生成現實中難以采集的極端或長尾場景，從而大幅降低訓練物理AI系統的成本與復雜度。該藍圖還將與云平臺結合，把大規模計算資源轉化為高效的數據生產引擎，幫助機器人、自動駕駛和視覺 AI 應用更快迭代與部署。

圍繞機器人，英偉達形成了完整的三層計算體系：用于訓練的計算機、用于合成數據和仿真的計算機，以及部署在機器人本體內部的計算機；同時配套 Isaac Lab、Newton、Cosmos、GR00T等軟件和模型棧。黃仁勛反復強調，真實世界過于復雜，“我們需要從AI和仿真中獲得新的數據”，單靠真機數據永遠不夠。

黃仁勛與機器人同臺，圖片來源：「甲子光年」拍攝

在自動駕駛和機器人部分，黃仁勛表示：“自動駕駛迎來了ChatGPT 時刻。”英偉達宣布新增比亞迪、現代、日產、吉利等車企加入RoboTaxi Ready平臺，并與ABB、Universal-Robots、Kuka、Caterpillar、Foxconn、Disney Research等公司合作，把物理AI推向制造、物流、自動駕駛和娛樂等更具體的現實場景。

黃仁勛宣布新增比亞迪等車企加入RoboTaxi Ready Platform，圖片來源：GTC 2026

在演講的壓軸環節，黃仁勛請出了一位特別嘉賓——由英偉達、迪士尼、谷歌DeepMind聯合打造的《冰雪奇緣》雪寶（Olaf）機器人。

雪寶機器人亮相GTC，圖片來源：GTC 2026

這個可愛的角色機器人能夠自主行走，還能與黃仁勛俏皮互動。雪寶通過NVIDIA Newton物理引擎在Omniverse中以深度強化學習訓練而成，黃仁勛開玩笑說：“你的電腦是我給的——Jetson，就在你肚子里?！彼€暢想未來迪士尼樂園里各種角色機器人自由漫步的場景。

最后，黃仁勛放了一部機器人唱歌、演奏的短片，如釋重負地坐在舞臺上，和雪寶一起享受這場機器人的表演。

黃仁勛和雪寶一起看機器人演出視頻，圖片來源：「甲子光年」拍攝

謝幕時他感慨道：“I still love Disney （我還是最喜歡迪士尼）?！?/p>

5.如何看黃仁勛這次演講

每年GTC，整個AI產業都在等待黃仁勛再一次定義這場技術革命的敘事。

過去兩年，圍繞生成式AI的討論大多集中在模型能力和算力規模，但最近黃仁勛發文，給出了一個更系統的框架——AI是一塊“五層蛋糕”（AI is a five-layer cake）：從底部的能源，到芯片、AI基礎設施，再到模型與應用，層層疊加，構成一整套新的工業體系。

五層蛋糕框架，圖片來源：英偉達

這個比喻背后的含義很清晰：AI是一場基礎設施革命。如果說過去的互聯網時代主要改變的是信息流，那么AI時代改變的則是算力、能源、數據中心和軟件系統共同構成的“生產系統”。在這個體系中，GPU只是其中一層，而真正決定產業規模的，是整塊蛋糕的協同生長。

黃仁勛認為，在過去的一年里，AI跨越了一個重要的門檻。模型性能顯著提升，可以大規模投入使用。推理能力增強，幻覺現象減少，落地應用能力大幅提升。基于AI構建的應用首次開始創造真實的經濟價值。

黃仁勛透露，去年GTC DC時他看到的高確信需求和訂單是5000億美元（覆蓋Blackwell和Rubin到2026年），而僅僅一年后，“站在今天這個位置，到2027年我看到的至少是1萬億美元”，而且他確信實際需求會遠高于此。

推動這一增長的核心是推理拐點的到來：AI從能感知、能生成，進化到能推理、能執行任務，每一次思考都要消耗推理算力，過去兩年所需的計算量增長了大約一萬倍。

與此同時，英偉達的客戶基礎也在快速擴大，他特別提到Anthropic和MSL（Meta）在過去一年選擇了英偉達平臺，加上多家開源模型廠商的加入，合計占據全球約三分之一的AI算力。從業務構成看，60%來自前五大超大規模云廠商，其中既包括內部AI消費（推薦系統、搜索等工作負載正在向大模型遷移），也包括通過英偉達生態落地的AI原生公司；另外40%則遍布區域云、主權AI、企業、工業、機器人和邊緣計算。黃仁勛強調，“AI的多樣性就是它的韌性，這不是一個單一應用的技術，這是一次根本性的計算平臺遷移?！?/p>

黃仁勛展示推理拐點驅動的增長，圖片來源：「甲子光年」拍攝

今年是CUDA的二十周年，黃仁勛認為，CUDA真正的壁壘在于二十年間積累的數以億計的GPU裝機量，覆蓋了全球每一家云廠商和幾乎每一個行業。

龐大的裝機量吸引開發者，開發者帶來算法突破，如深度學習等。而突破催生新市場，新市場又進一步擴大裝機量，形成持續加速的飛輪。

他以六年前發貨的Ampere GPU為例，稱其云端定價不降反升，原因是CUDA生態下可運行的應用極其豐富，基礎設施的有效使用壽命遠超預期。英偉達也因此愿意持續為所有在役GPU更新軟件，每一次優化都能惠及數百萬用戶，不斷壓低計算成本，而更低的成本又反過來刺激新的增長。

CUDA20周年，圖片來源：「甲子光年」拍攝

一直以來，憑借GPU架構和CUDA生態的壁壘，英偉達締造了AI時代的算力帝國，占據全球90%的算力市場份額。

但未來呢？

「甲子光年」認為，觀察今年GTC的一個重要視角，是看英偉達如何在這五層結構中守住并繼續擴展自己的位置。從下一代GPU架構、機架級AI系統，到推理時代的數據中心設計，再到Agent與物理AI應用，英偉達正在堅定把自己從一家芯片公司，重新定義為AI基礎設施的核心平臺提供者。

這是一次必須要做的轉型，也是一次充滿意味的新敘事。

（封面圖來源：GTC 2026）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.