撰稿|陳茜
1萬(wàn)億美元,這是接下來(lái)21個(gè)月,英偉達(dá)GPU訂單的收入預(yù)期。
剛過(guò)去的GTC大會(huì),黃仁勛開(kāi)始停止了講芯片的故事。他開(kāi)始瞄準(zhǔn)更大的敘事:token經(jīng)濟(jì),而這將是更有野心且更持久的市場(chǎng)蛋糕。
![]()
本篇文章,我們將拆解英偉達(dá)的五層蛋糕生態(tài)體系。一萬(wàn)億美元收入是怎么算出來(lái)的?基于Groq的LPU將給英偉達(dá)帶來(lái)什么新的機(jī)會(huì)?還有黃仁勛在光通信上的提前布局與未來(lái)Scale-across(跨區(qū)域擴(kuò)展)的AI工廠機(jī)會(huì)。以及OpenClaw的里程碑后,英偉達(dá)押注的token經(jīng)濟(jì)學(xué)將會(huì)如何發(fā)展,給算力市場(chǎng)將帶來(lái)如何的挑戰(zhàn)呢?
(本文為視頻改寫,歡迎大家收看以下視頻)
01
推理拐點(diǎn)已至
多模態(tài)+OpenClaw
2026年的英偉達(dá)的GTC敘事建立在兩個(gè)背景和事件:一是AI應(yīng)用得到落地;二是OpenClaw的爆火帶動(dòng)了全球的agent生態(tài)。這讓黃仁勛在GTC演講中高呼,推理拐點(diǎn)已經(jīng)到來(lái)。
新云(Neocloud)廠商GMI Cloud創(chuàng)始人Alex Yeh在跟我們對(duì)話中就透露,北美的需求暴增是來(lái)自多模態(tài)和編程,而OpenClaw帶來(lái)的token需求則主要來(lái)自中國(guó)。
![]()
Alex Yeh GMI Cloud創(chuàng)始人 Token(詞元)的推理使用量一直在暴增,而且是以倍數(shù)的方式在增長(zhǎng)。我們的客戶也從大型的訓(xùn)練客戶轉(zhuǎn)到很多推理需要的邊緣端的節(jié)點(diǎn)。(美國(guó)這邊)一個(gè)是以代碼生成為首的推理調(diào)量,另一個(gè)是多模態(tài)的視頻和圖片生成,這兩個(gè)發(fā)展的速度都太快了。我覺(jué)得在OpenClaw這一塊,美國(guó)的市場(chǎng)事實(shí)上還沒(méi)有意識(shí)到這個(gè)影響究竟有多大。
Alex的觀察和我們最近在硅谷與很多業(yè)內(nèi)人士的探討是相似的,因?yàn)楸泵烙脩簦貏e是有技術(shù)背景的開(kāi)發(fā)者已經(jīng)很適應(yīng)用Claude Cowork去做一些agent任務(wù)。所以雖然OpenClaw是從硅谷火出圈的,但遠(yuǎn)沒(méi)有到國(guó)內(nèi)那么卷的程度。
![]()
Alex Yeh GMI Cloud創(chuàng)始人 我覺(jué)得OpenClaw是從國(guó)內(nèi)火到這邊來(lái),可是國(guó)內(nèi)已經(jīng)先開(kāi)始一波了,現(xiàn)在也是在Mac mini或者DGX Spark上跑,可是我覺(jué)得這不是一個(gè)常態(tài)。因?yàn)檫@東西絕對(duì)之后都是上云的,畢竟部署一個(gè)PC的成本實(shí)在是太高。而且我看到很多的硅谷公司已經(jīng)在做一個(gè)零代碼、用戶界面非常好用的OpenClaw。隨著開(kāi)源和閉源的模型越來(lái)越好,它的調(diào)用量會(huì)越來(lái)越高。所以我覺(jué)得我們甚至連1%或5%都還沒(méi)有到。可是這才剛開(kāi)始,全球(算力)就已經(jīng)沒(méi)了,token調(diào)用規(guī)模未來(lái)的發(fā)展是超級(jí)可怕的。
所以,以上是目前AI發(fā)展現(xiàn)狀的一個(gè)大背景。有了推理需求飆升和OpenClaw爆火這兩個(gè)趨勢(shì),黃仁勛的整個(gè)演講的敘事邏輯就完全和去年不同了:以前英偉達(dá)賣芯片給云廠商和AI公司,而如今,老黃要賣token給全世界每一家公司。
黃仁勛 英偉達(dá)創(chuàng)始人&CEO 每一個(gè)企業(yè),全球的每一家軟件公司,都需要一套智能體系統(tǒng),需要一套智能體策略,需要擁有一套OpenClaw策略。
![]()
這也是我參加今年老黃keynote的最大感受,看看PPT上面的這些小心心,就知道黃仁勛的姿態(tài)是we love everybody(我們擁抱所有人)。所以,今年GTC的最關(guān)鍵主題是“生態(tài)”,而不是“芯片”。
早在GTC開(kāi)會(huì)的幾天前,英偉達(dá)就放出了一篇名為“AI五層蛋糕”的文章來(lái)為大會(huì)造勢(shì),預(yù)示黃仁勛在今年大會(huì)上強(qiáng)調(diào)的是垂直整合能力和生態(tài),而不是單芯片。
![]()
簡(jiǎn)單來(lái)說(shuō),黃仁勛給外界畫了一個(gè)更大的餅。我們先來(lái)說(shuō)黃仁勛在GTC演講中提到的一萬(wàn)億這個(gè)數(shù)字。
02
一萬(wàn)億美元
過(guò)于保守還是極度樂(lè)觀?
黃仁勛在去年的GTC上說(shuō),當(dāng)前和下一代的GPU架構(gòu)Blackwell和Vera Rubin的訂單收入,從當(dāng)時(shí)到2026年年底會(huì)達(dá)到5000億美元。這次,他將這個(gè)預(yù)期直接上調(diào)了一倍,說(shuō)截止現(xiàn)在,到2027年年底,預(yù)計(jì)光是Blackwell和Vera Rubin的訂單收入,會(huì)直接到1萬(wàn)億美元。
![]()
要注意,這個(gè)收入是不包括英偉達(dá)新發(fā)的CPU和基于Groq的LPU芯片等其他產(chǎn)品線的訂單收入,而光是GPU架構(gòu)的訂單。他在媒體閉門會(huì)上專門特別澄清,原因是因?yàn)檫@樣外界能直觀的感受到英偉達(dá)的GPU上的業(yè)務(wù)增長(zhǎng)。
黃仁勛 英偉達(dá)創(chuàng)始人&CEO 如果我把這1萬(wàn)億的業(yè)務(wù)范圍進(jìn)行更改,將CPU、Groq以及存儲(chǔ)包含在內(nèi),那就會(huì)把兩件不同的事情混為一談,這樣我在進(jìn)行比較時(shí)就不夠簡(jiǎn)單直接了。然而,對(duì)其他人來(lái)說(shuō),理解這1萬(wàn)億的復(fù)雜之處在于:既然英偉達(dá)今天能提供多得多的產(chǎn)品,難道我們是在暗示Blackwell加上Vera Rubin的規(guī)模還不到1萬(wàn)億嗎?不,情況恰恰相反。
![]()
任揚(yáng) 濟(jì)容投資聯(lián)合創(chuàng)始人 首先這個(gè)數(shù)字我覺(jué)得非常achievable(可實(shí)現(xiàn)的)。第二,這個(gè)數(shù)字是到現(xiàn)在為止它看到的實(shí)實(shí)在在的訂單,可能過(guò)幾個(gè)月咱們回頭再看這個(gè)數(shù)字,它還有新的訂單出來(lái),這一萬(wàn)億的數(shù)字還會(huì)往上走。 我覺(jué)得從財(cái)務(wù)分析角度來(lái)說(shuō),它的意義就是給2027年的營(yíng)收和利潤(rùn)劃了一個(gè)底,告訴你這個(gè)底在這兒了。然后把它這一萬(wàn)億的數(shù)字放在模型里面,就能劃出來(lái)2027年十三、四塊錢的EPS(每股收益)的底。
而對(duì)于各大企業(yè)對(duì)算力的CapEx(資本支出),我們的嘉賓認(rèn)為是還將繼續(xù)上漲,一邊是推理需求會(huì)繼續(xù)上漲,另一邊的原因是隨著前沿模型的競(jìng)爭(zhēng)趨于白熱化,訓(xùn)練這邊的需求也不會(huì)降低。
![]()
圖片來(lái)源:Business Insider
任揚(yáng) 濟(jì)容投資聯(lián)合創(chuàng)始人 我覺(jué)得百分比的增速會(huì)放慢,但是它肯定還是一個(gè)快速增長(zhǎng)的狀態(tài),而且我覺(jué)得每年增長(zhǎng)的絕對(duì)值數(shù)量不一定會(huì)變小。第一,Inference(推理) 的用量現(xiàn)在很明顯看到有一個(gè)inflection(拐點(diǎn)),大家對(duì)agent的用量和token的消耗量明顯提升。第二,我覺(jué)得從模型廠商的角度來(lái)說(shuō),這幾家前沿實(shí)驗(yàn)室沒(méi)有誰(shuí)能明顯地拉開(kāi)和其他人的身位,都是在一個(gè)交替領(lǐng)先的狀態(tài),包括開(kāi)源的這些大模型也沒(méi)有明顯地比閉源的proprietary(專有)模型落后非常遠(yuǎn)。
我覺(jué)得模型廠商后面可能只有兩條路:要不就是往上打,只有做了應(yīng)用之后,做出用戶粘性,通過(guò)應(yīng)用去收錢。另外一條路就是,花錢花得比別人更狠,用資產(chǎn)負(fù)債表或者現(xiàn)金流的優(yōu)勢(shì),更大力度地懟算力、懟人才,希望在模型上能有一個(gè)突破。OpenAI之前有一段時(shí)間是想走這條路,包括去年Sam Altman喊出來(lái)1.4萬(wàn)億這種數(shù)字。 我覺(jué)得這兩條路大家都還會(huì)繼續(xù)去做,所以對(duì)CapEx(資本開(kāi)支)的投入一定不會(huì)小。
為什么黃仁勛今年不強(qiáng)調(diào)單芯片,連Rubin再下一代計(jì)算架構(gòu)Feynman也只是略微提了一點(diǎn)?除了老黃要把英偉達(dá)的企業(yè)敘事拔高到“AI factory”以及要給所有人賣token之外,其實(shí)還因?yàn)楫a(chǎn)能跟不上,市面上還是瘋狂缺卡。現(xiàn)在市面上大家根本買不到最先進(jìn)的卡,就連兩三年前發(fā)布的舊卡,H100、H200用了幾年甚至能超原價(jià)賣,同時(shí)軟件生態(tài)和各種配置也都跟不上老黃的速度,所以他再?gòu)?qiáng)調(diào)單卡的性能提升,對(duì)市場(chǎng)來(lái)說(shuō)根本沒(méi)有意義。
![]()
錢宇靖 GMI工程主管 現(xiàn)在市場(chǎng)上最成熟的平臺(tái)依然是Hopper最多,Blackwell在最近幾個(gè)月開(kāi)始進(jìn)入大規(guī)模應(yīng)用的階段,并且軟件層也有比較好的進(jìn)步。但是回想一下,Blackwell是在兩年前就已經(jīng)被宣發(fā)了的,所以我覺(jué)得是因?yàn)楝F(xiàn)在的產(chǎn)能還是沒(méi)有辦法跟當(dāng)時(shí)老黃所預(yù)計(jì)的產(chǎn)能達(dá)到一致。
所以看起來(lái),光是GPU的售賣,這一萬(wàn)億美元的收入規(guī)模并不算過(guò)度樂(lè)觀,而是真有這樣的需求量。但顯然,黃仁勛是不滿足這一萬(wàn)億的,他布局的是全生態(tài)。當(dāng)token成為大宗商品,“算力即收入”,黃仁勛接下來(lái)的動(dòng)作,是想把他定義中的“AI五層蛋糕”給全部打透,讓英偉達(dá)持續(xù)成為AI產(chǎn)業(yè)線中,持續(xù)最賺錢的機(jī)器。
03
拆解五層蛋糕
同質(zhì)化博弈與生態(tài)護(hù)城河
Chapter 3.1:五層蛋糕與“同質(zhì)化”
黃仁勛定義的AI五層蛋糕,從下到上,分別是能源層(這里是電力等基礎(chǔ)供應(yīng)),之后是芯片層(英偉達(dá)的核心業(yè)務(wù):卡),再之上是基建層(包括云廠商及旗下的數(shù)據(jù)中心,再往細(xì)分就是土地、供電、冷卻系統(tǒng)、建筑工程、網(wǎng)絡(luò)通信等),前三層被統(tǒng)稱為AI工廠(AI factories)。
![]()
再往上,模型層有OpenAI、谷歌Gemini和Anthropic這樣的頂尖模型,也有包括英偉達(dá)自研的一系列開(kāi)源模型。而在應(yīng)用層,則是英偉達(dá)針對(duì)不同的賽道研發(fā)技術(shù),包括機(jī)器人、自動(dòng)駕駛、工業(yè)制造、編程和企業(yè)級(jí)AI Agent等等。
你是不是有點(diǎn)疑惑,老黃是在布一盤什么局呢?這五層蛋糕難道每一層英偉達(dá)都能吃透嗎?
任揚(yáng) 濟(jì)容投資聯(lián)合創(chuàng)始人 如果把其他這幾層能commoditize(同質(zhì)化)掉,或者說(shuō)把他們的利潤(rùn)打下來(lái),讓利潤(rùn)就集中到你這一層。這一層里到底誰(shuí)是瓶頸,稀缺價(jià)值到底是集中在哪一層。之前幾年稀缺價(jià)值完全是集中在芯片這一層,所以Nvidia吃到了這一輪絕大部分的利潤(rùn)和蛋糕,但是上面幾層都還是非常有實(shí)力的。
我們的嘉賓任楊認(rèn)為,每一層蛋糕中,如果每個(gè)玩家水平都差不多,沒(méi)有絕對(duì)領(lǐng)先或者絕對(duì)壟斷者,那么這一層的利潤(rùn)就會(huì)被攤薄,這被稱為“being commoditized”(同質(zhì)化)。議價(jià)權(quán)最終還是回到有絕對(duì)領(lǐng)先和壟斷的這一層,也就是英偉達(dá)的芯片層。
也就是說(shuō),最終黃仁勛還是要靠賣芯片。但在其它層的蛋糕中,英偉達(dá)要扶持起自己的軟件生態(tài),定義規(guī)則。就像打造CUDA這樣的護(hù)城河一樣,一旦在新的市場(chǎng)定義了范式,當(dāng)市場(chǎng)爆發(fā),大家發(fā)現(xiàn)最好用的還是英偉達(dá)的平臺(tái),那最后要買的依然是英偉達(dá)的算力和卡。
![]()
比如說(shuō),英偉達(dá)看到基建層,像谷歌云和AWS這樣的云廠商有強(qiáng)議價(jià)權(quán)之后,又扶持起了CoreWeave和Nebius這樣的Neocloud(新云平臺(tái))來(lái)進(jìn)行競(jìng)爭(zhēng)。再比如說(shuō),在模型層,英偉達(dá)各種大小模型開(kāi)源了一大堆,而且這次黃仁勛專門組織了一場(chǎng)全球最核心的開(kāi)源模型論壇,就是想在模型這一層,試圖在長(zhǎng)期削弱SOTA(State of the Art,最頂尖)的頂級(jí)閉源模型的議價(jià)權(quán)。而在應(yīng)用層,英偉達(dá)也在研發(fā)自動(dòng)駕駛和機(jī)器人,等待行業(yè)大規(guī)模爆發(fā),為的就是提前布局生態(tài)位。
任揚(yáng) 濟(jì)容投資聯(lián)合創(chuàng)始人 如果Nvidia能夠鼓勵(lì)或者帶領(lǐng)開(kāi)源社區(qū)快速迭代,把token價(jià)格打下來(lái)。雖然說(shuō)Anthropic和OpenAI在賣API、賣inference(推理)、賣token上是賺錢的,但如果開(kāi)源模型能夠用10%的價(jià)格,做到現(xiàn)在的前沿實(shí)驗(yàn)室的這些最先進(jìn)的模型的90%的性能,那這些token的價(jià)格一定會(huì)被打下來(lái)。然后就把賣模型、賣推理、賣token這一層commoditize(同質(zhì)化)掉,整個(gè)生態(tài)里面最后賺錢的又回到了Nvidia這邊。
所以老黃正在時(shí)刻關(guān)注的其他層級(jí)的蛋糕,但最賺錢的,始終還是芯片這一層。所以這一層也是黃仁勛盯得最緊的。而這次的GTC上,傳達(dá)出兩個(gè)信號(hào)。
Chapter 3.2:基于Groq的ASIC反擊戰(zhàn)
第一個(gè)信號(hào)就是在芯片層,老黃發(fā)布了基于Groq研發(fā)出的LPU。要知道,對(duì)Groq的非獨(dú)家技術(shù)授權(quán)交易是去年12月圣誕節(jié)前后才宣布的,花了200億美元現(xiàn)金,可以說(shuō)是英偉達(dá)有史以來(lái)最大的一起交易。
![]()
Groq創(chuàng)始人Jonathan Ross在最新的福布斯雜志采訪中爆料說(shuō),和Groq的交易這件事情也是老黃只花了三周就迅速做的決定。
而到如今的GTC才3個(gè)月,產(chǎn)品就已經(jīng)出來(lái)了,只能說(shuō),老黃和英偉達(dá)卷起來(lái)真的沒(méi)其他人什么事兒了。那么,為什么要“收編”Groq呢?
簡(jiǎn)單來(lái)說(shuō)就是GPU架構(gòu),即使強(qiáng)如Vera Rubin,擅長(zhǎng)的是高吞吐的并行計(jì)算,做prefill(上下文預(yù)處理)和attention(注意力計(jì)算)很厲害,但在超高速token生成(decode)這個(gè)任務(wù)上就沒(méi)那么給力了。因?yàn)閠oken生成的特點(diǎn)是只能一個(gè)一個(gè)的生成,整個(gè)過(guò)程必然是串行鏈?zhǔn)降模瑢?duì)每一步延遲極其敏感。
所以,“高吞吐”和“低延遲”本身互相矛盾,很難兩全。而Groq就是這個(gè)矛盾的解法。
![]()
Graham Steele 英偉達(dá)工作人員 LPX發(fā)揮作用的地方就在于那些極高交互率的場(chǎng)景。單獨(dú)的Rubin非常適合用來(lái)處理絕大多數(shù)的推理工作負(fù)載,當(dāng)涉及到超大模型、超長(zhǎng)上下文以及極高交互性時(shí),這就是LPX發(fā)揮作用的地方,它能為Vera Rubin提供額外的提升。
Groq通過(guò)SRAM(靜態(tài)隨機(jī)存取存儲(chǔ)器)設(shè)計(jì),天生就適合做推理和token生成。就像Groq創(chuàng)始人Ross打動(dòng)黃仁勛的那個(gè)類比,他說(shuō)強(qiáng)大的GPU就像“18輪大卡車”,但推理任務(wù)就像“最后一公里配送”,本身就更適合更靈活高效的面包車。他對(duì)老黃說(shuō),如果你要為美國(guó)建立一個(gè)物流網(wǎng)絡(luò),最佳答案是,18輪卡車和面包車你都需要。
![]()
而在OpenClaw之后的Agent時(shí)代,老黃通過(guò)與Groq的深度技術(shù)與人才合作,解決了token生成的挑戰(zhàn),這是非常關(guān)鍵的一步。而Groq的新芯片融入英偉達(dá)體系后,英偉達(dá)宣稱這將解鎖3000億美金的增量市場(chǎng),可以說(shuō),這200億花得值了。但還有個(gè)內(nèi)存上的小難題:SRAM缺點(diǎn)是第一很貴、第二很占面積、第三容量做不大。
單顆Groq 3 LPU只有500MB SRAM,而Rubin GPU是288GB HBM4,差了500多倍,根本存不下萬(wàn)億參數(shù)的模型。英偉達(dá)的解法是用Dynamo軟件把推理過(guò)程拆成兩半,Vera Rubin這邊的GPU負(fù)責(zé)prefill和attention,而Groq負(fù)責(zé)之后decode和token生成。
![]()
所以我們看到,一顆Rubin GPU配上8顆Groq 3 LPU,統(tǒng)一為一個(gè)推理單元。而Groq 3 LPX整機(jī)把256顆LPU裝進(jìn)一個(gè)機(jī)架,能提供128GB SRAM、40PB/s帶寬、315 PFLOPS推理算力和640TB/s互連帶寬。
英偉達(dá)和Groq的這個(gè)交易目前還面臨反壟斷的一些潛在調(diào)查,因?yàn)樯嫦印白兿嗍召?gòu)”(雖然這個(gè)做法已經(jīng)是硅谷巨頭在AI時(shí)代的基本操作了)。但LPU已經(jīng)和三星在合作量產(chǎn)了,預(yù)計(jì)今年第三季度出貨,而Vera Rubin機(jī)架已經(jīng)在微軟Azure云上運(yùn)行。
![]()
同時(shí),英偉達(dá)聯(lián)手Groq還有一個(gè)戰(zhàn)略上的意義,就是打出了ASIC反擊戰(zhàn)。,以及各個(gè)云廠商也都在扶持ASIC芯片的研發(fā)試圖蠶食英偉達(dá)GPU的利潤(rùn)率和議價(jià)權(quán),包括谷歌的TPU也是ASIC芯片,Groq本身也是ASIC芯片。但英偉達(dá)這次告訴外界:我也可以做ASIC芯片,而且還跟我自己的GPU結(jié)合,性能更強(qiáng)哦!
黃仁勛 英偉達(dá)創(chuàng)始人&CEO 但是有了這種架構(gòu),我們將把我們的token生成速度、生成率從200萬(wàn)提升到7億,實(shí)現(xiàn)了350倍的增長(zhǎng)。這就是extreme co-design(極致協(xié)同設(shè)計(jì)),我們要在垂直方向上進(jìn)行整合與優(yōu)化,然后再在水平方向上將其開(kāi)放,供所有人享有。Chapter 3.3:枯木逢春的CPU與備受期待的CPX
我們?cè)賮?lái)看看芯片層的第二個(gè)關(guān)鍵詞:CPU,是不是有種“枯木逢春”的感覺(jué)。AI agent時(shí)代token經(jīng)濟(jì)的崛起不但救了Groq一命,連老古董CPU也重新成為了香餑餑。
雖然GPU擅長(zhǎng)訓(xùn)練和運(yùn)行AI模型,但隨著Agent工作負(fù)載的不斷增長(zhǎng),這些系統(tǒng)需要傳輸海量數(shù)據(jù),并協(xié)調(diào)跨多個(gè)智能體的工作流程,這使得CPU在現(xiàn)代AI基礎(chǔ)設(shè)施中的重要性絲毫不亞于GPU。
![]()
所以,英偉達(dá)在這次GTC上發(fā)布了Vera CPU,被稱為“全球首款專為代理式AI與強(qiáng)化學(xué)習(xí)時(shí)代打造的處理器”,其效率是傳統(tǒng)機(jī)架級(jí)CPU的2倍,速度提升50%。包括AI編程明星公司Cursor也為Vera CPU站臺(tái),說(shuō)提升了他們的整體吞吐量和效率,給客戶帶來(lái)了更快速靈敏的編程agent體驗(yàn)。
![]()
Praveen Menon 英偉達(dá)工作人員 這些CPU是專為AI工廠打造的。當(dāng)你們的GPU進(jìn)行推理或強(qiáng)化學(xué)習(xí)訓(xùn)練時(shí),它們會(huì)生成大量的軟件代碼,這些代碼需要被評(píng)估正確與否,然后反饋需要傳回給GPU。CPU承擔(dān)了評(píng)估這些代碼的任務(wù),所以在那個(gè)階段,你需要一個(gè)非常快的CPU來(lái)向GPU提供評(píng)估反饋,這樣GPU就不需要加權(quán)了。這就是為什么我們專門打造這款產(chǎn)品,它具備極高的單核性能以及極大的內(nèi)存帶寬,這樣數(shù)據(jù)就可以無(wú)縫移動(dòng),并且所有環(huán)節(jié)都能達(dá)到非常出色的機(jī)架級(jí)性能效率。所以,將所有這些結(jié)合在一起,就成就了一款非常適合智能體任務(wù)和AI工廠的理想CPU。
在芯片層這里,還有一個(gè)秘密武器就是CPX。
這是黃仁勛在去年9月的AI基礎(chǔ)設(shè)施峰會(huì)上推出的、專門針對(duì)長(zhǎng)語(yǔ)境推理進(jìn)行優(yōu)化的芯片,可以說(shuō)代表了GPU設(shè)計(jì)的一個(gè)全新類別。這款芯片能夠處理百萬(wàn)級(jí)tokens的軟件編程和生成式視頻,在速度和效率方面實(shí)現(xiàn)突破性提升,被外界認(rèn)為能進(jìn)一步穩(wěn)固英偉達(dá)在推理上的優(yōu)勢(shì)。
![]()
有意思的是,老黃這次的演講中根本沒(méi)有提到CPX,也讓業(yè)界很好奇,英偉達(dá)目前在芯片層的這套組合拳:GPU、CPU、LPU、CPX,是否會(huì)進(jìn)一步拉開(kāi)與競(jìng)爭(zhēng)對(duì)手的差距。
任揚(yáng) 濟(jì)容投資聯(lián)合創(chuàng)始人 我的理解是,在根據(jù)不同類型的工作負(fù)載,英偉達(dá)都有能夠拿出來(lái)非常好用的產(chǎn)品,放到它的機(jī)柜里面。英偉達(dá)想要提供一個(gè)最完整、最全面的服務(wù),想要什么東西我都有,全都買我的東西最方便的感覺(jué)。
總結(jié)一下,這五層蛋糕互相支撐但又互相牽制,黃仁勛在做的是要整合這五層,確保英偉達(dá)在每一層都有話語(yǔ)權(quán),無(wú)論是扶持甲方的競(jìng)爭(zhēng)對(duì)手,還是自研開(kāi)源模型,還是在不同領(lǐng)域保持開(kāi)放合作來(lái)定義行業(yè)入口和范式。
![]()
英偉達(dá)的敘事早已不是“芯片”而已了,黃仁勛在發(fā)布會(huì)上手握單芯片的那些名場(chǎng)面已經(jīng)成為過(guò)去。未來(lái),是完整的AI factory,是更宏大的token經(jīng)濟(jì)學(xué)。這讓英偉達(dá)的護(hù)城河也早已超越CUDA,讓競(jìng)爭(zhēng)對(duì)手們更難攻破它的生態(tài)帝國(guó)。
04
前沿技術(shù)布道CPO、太空數(shù)據(jù)中心與Scale-across布局
黃仁勛一直在布局下一個(gè)即將爆發(fā)的產(chǎn)業(yè),也對(duì)前沿技術(shù)非常的敏銳。他這次在發(fā)布會(huì)上沒(méi)太多提共封裝光學(xué)CPO,以及數(shù)據(jù)中心中機(jī)組的Scale-up(縱向擴(kuò)容)和Scale-out(橫向擴(kuò)容)。
![]()
但英偉達(dá)在3月初分別向光子技術(shù)巨頭Lumentum和Coherent各注資20億美元,并鎖定數(shù)十億美元采購(gòu)承諾及未來(lái)產(chǎn)能權(quán)益。這兩家公司都是CPO的核心供應(yīng)鏈,業(yè)內(nèi)人士認(rèn)為,黃仁勛這是在準(zhǔn)備為下一代“吉瓦級(jí)AI工廠”去鋪墊光互聯(lián)的底座。
![]()
Cathy Jiang 光學(xué)工程師 一個(gè)是Lumentum,它是現(xiàn)在唯一的高功率(400毫瓦)DFB激光器的一個(gè)供應(yīng)商,在最近的OFC會(huì)議上,它們也提到了一個(gè)更高參數(shù)的1瓦強(qiáng)功率的激光器。另外一個(gè)是Coherent,這是在硅光光子學(xué)中有很多技術(shù)積累的幾個(gè)公司合并在一起的一個(gè)公司。這兩家公司,一是他們是美國(guó)公司,二是有多年的技術(shù)積累和專利的積累,三是在整個(gè)產(chǎn)業(yè)鏈上,這種投資可以幫助這些公司在下一代的技術(shù)中做更多的革新。
這一次它們更多的技術(shù)革新是在封裝方面,比如說(shuō)2.5D到3D的封裝。但是接下來(lái)這兩家公司還在進(jìn)行更多的新技術(shù)的研發(fā),比如說(shuō)使用更多的光波長(zhǎng)一起進(jìn)行通信,進(jìn)一步地增加它的帶寬的密度。還有使用一些更加先進(jìn)的技術(shù),比如說(shuō)不同的放置激光器的方法,甚至探索一些不同的波段、不同光纖的參數(shù)等等更下一步的技術(shù)革新。
目前產(chǎn)業(yè)里面還在討論Scale-up(縱向擴(kuò)容)和Scale-out(橫向擴(kuò)容),而行業(yè)人士說(shuō),黃仁勛已經(jīng)在思考說(shuō)再下一步,Scale-across(跨域擴(kuò)展),也就是不同數(shù)據(jù)中心的互聯(lián)怎么去解決了。
Cathy Jiang 光學(xué)工程師 對(duì)于不同的距離的場(chǎng)景,比如說(shuō)Scale-up(縱向擴(kuò)容)談?wù)摰氖呛撩琢考?jí),Scale-out(橫向擴(kuò)容)討論的是米量級(jí),Scale-across(跨域擴(kuò)展)可能討論的是千米或者更遠(yuǎn)的量級(jí)。在這些不同量級(jí)之下,什么是一個(gè)最優(yōu)的技術(shù)路線?我們還是用現(xiàn)在的波長(zhǎng),還是要換成一個(gè)其他的波長(zhǎng)?會(huì)不會(huì)有一個(gè)技術(shù)是用現(xiàn)在這種光纖,還是一種中間是空著的光纖?會(huì)不會(huì)有一個(gè)技術(shù)突然出現(xiàn)就砸了場(chǎng)子,把其他的技術(shù)都帶跑了?都是很有意思的一些討論。
當(dāng)然,還有更遙遠(yuǎn)的一些布局,包括在演講中黃仁勛提到的太空數(shù)據(jù)中心等等,我們也寫過(guò)一篇文章介紹。
在這篇文章的最后,我還想稍微聊聊整個(gè)芯片和數(shù)據(jù)中心供應(yīng)鏈目前的一個(gè)情況。如果大家還記得這五層蛋糕,可以看到能源和數(shù)據(jù)中心供應(yīng)鏈的基礎(chǔ)層,決定了芯片的產(chǎn)能,也決定了整個(gè)AI模型和應(yīng)用能否得到足夠的算力支撐,也決定了AI的進(jìn)程。
05
供應(yīng)鏈全面吃緊內(nèi)存與能源的超級(jí)周期
我們?cè)贕TC期間跟供應(yīng)鏈的朋友聊天,得到的信息是:缺,什么都短缺。
Alex Yeh GMI Cloud創(chuàng)始人 我們是了解所有的硬件的缺貨情況的,包括從各類元器件到內(nèi)存端的硬件,比如CX7等等子元器件。現(xiàn)在每一個(gè)元器件都開(kāi)始“亮紅燈”,就是指大缺貨、大漲價(jià),DDR4的DRAM價(jià)格,是一年前的10倍。現(xiàn)在CX7也在缺貨、電源供應(yīng)和CPU也開(kāi)始在缺貨,各個(gè)供應(yīng)鏈都開(kāi)始缺貨。我看到OpenClaw的起來(lái)、agent起來(lái)、多模態(tài)的起來(lái)以及編程的起來(lái),剛好這三個(gè)是一個(gè)完美的風(fēng)暴,所有的供應(yīng)鏈就跟不上這個(gè)節(jié)奏。
![]()
Alex對(duì)我們表示,最近全球地緣政治,特別是中東的波動(dòng)讓能源價(jià)格異常波動(dòng),這也給全球AI數(shù)據(jù)中心的能源供應(yīng)帶來(lái)了更高不確定性,但能源這一部分大概會(huì)占到token定價(jià)的10%左右,而讓token價(jià)格高居不下的,還是供應(yīng)鏈短缺帶來(lái)的價(jià)格飆升,特別是內(nèi)存方向。
Alex Yeh GMI Cloud創(chuàng)始人 我覺(jué)得影響最大的還是服務(wù)器系統(tǒng)的內(nèi)存的漲價(jià),從而造成token價(jià)格的增加。
而我們也在會(huì)展現(xiàn)場(chǎng)采訪到了內(nèi)存市場(chǎng)的決定性大贏家三星,他們認(rèn)為,緊缺的狀態(tài)至少要持續(xù)到27年年底。
![]()
Candice Hu Samsung Memory產(chǎn)品營(yíng)銷經(jīng)理 這個(gè)是我們從來(lái)沒(méi)有看到過(guò)的supercycle(超級(jí)周期),之前幾年也有,但是那個(gè)時(shí)候更多是手機(jī)、電腦、互聯(lián)網(wǎng)端的需求,但是今年整個(gè)就是AI。我們看到2026年已經(jīng)是完全的售罄,2027年我們認(rèn)為也還是會(huì)在緊缺的狀態(tài)。產(chǎn)線我們都已經(jīng)在投入了,但是大概率也要到2028年才能有實(shí)質(zhì)性的這么一個(gè)上漲。 這個(gè)超級(jí)周期,很多的采購(gòu)方都是云端、數(shù)據(jù)中心,他們對(duì)于成本的敏感度是比較低的,也比較愿意花錢去買。所以整個(gè)內(nèi)存的短缺或者是需求量,我們認(rèn)為在接下來(lái)兩年還是會(huì)比較強(qiáng)的。
以上就是我們這次的參會(huì)體驗(yàn)啦。給我的感覺(jué)是,隨著Agenic時(shí)代來(lái)臨,非常多的范式會(huì)發(fā)生變化,有機(jī)遇也有挑戰(zhàn),而GTC會(huì)依然是AI行業(yè)的指路標(biāo),我們也會(huì)為大家繼續(xù)關(guān)注以上我們的提到的這些產(chǎn)業(yè)和方向。不知道在一年后的GTC大會(huì),我們的世界會(huì)被AI加速多少呢?
注:部分圖片來(lái)源于網(wǎng)絡(luò)
【本期節(jié)目不構(gòu)成任何投資建議】
【視頻播放渠道】
國(guó)內(nèi):B站|騰訊|視頻號(hào)|西瓜|頭條|百家號(hào)|36kr|微博|虎嗅
海外:Youtube
聯(lián)系我們:video@sv101.net
【創(chuàng)作團(tuán)隊(duì)】
監(jiān)制|泓君 陳茜
撰稿/主持 |陳茜
剪輯|橘子
動(dòng)效|Jacob
運(yùn)營(yíng)|孫澤平 王梓沁
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.