從算力層面來看,英偉達的芯片產品是行業發展的核心風向標。作為全球AI計算芯片領域占據絕對市場份額的龍頭企業,英偉達的產品迭代節奏,對整個AI硬件行業具備極強的指引作用。
從英偉達的產品迭代來看,芯片制程正在持續微縮。此前推動全球半導體產業制程持續迭代的核心動力是智能手機,比如此前臺積電最先進的制程工藝,絕大部分產能都優先供應蘋果公司。但現在,推動半導體制程迭代的核心主角已經發生變化,未來這一趨勢也將持續延續。
為什么要持續推進制程升級?核心是讓AI計算能夠充分受益于摩爾定律帶來的性能紅利。但摩爾定律的迭代速度相對有限,通常需要兩年多時間才能實現性能翻倍。當前半導體制程逐漸逼近1納米物理極限,摩爾定律的迭代速度還在持續放緩。但與此同時,AI算力需求呈現爆發式增長,如何填補這一供需缺口,成為行業核心命題。
在這樣的行業背景下,行業選擇通過擴大芯片部署規模來滿足算力需求——當摩爾定律帶來的單芯片性能提升跟不上算力需求增長時,就通過增加芯片投放量、擴建數據中心的方式,填補算力缺口。這也直接推動了算力芯片市場的高速增長。海外市場中,無論是英偉達的GPU,還是谷歌的TPU等AI算力芯片,均實現了極快的增長。以上就是算力層面的行業發展趨勢。
對于存儲的情況,其最本質的需求就來自于AI的帶動。因為我們知道,AI領域需要大量存儲來存放數據,不管是GPU上面有很多的HBM——HBM就是一種高帶寬內存。除了HBM以外,英偉達還在其機柜里面配置了大量DRAM、NAND等存儲芯片,催生了對應的需求。現在隨著agent的快速發展以及放量,尤其推理市場現在起量得這么快,我們知道很多用戶,比如很多人可以看到自己的公司里面可能已經部署了一些大模型了。這種大模型在部署的時候,本身帶有海量參數,每個大模型的參數規模都極為龐大,用來存儲這些參數的存儲需求也十分強勁。后續大模型還在不斷地走強,那么從這一發展邏輯來看,后續存儲的需求還會快速地增加。就目前來看,存儲的漲價可能還會持續一段時間。所以存儲的景氣度,本質上還是來源于AI的計算需求在快速地增長,從而帶來的價格上行效應。
而運力,是我們今天想重點給大家分享的板塊。其實對于運力而言,其組網邏輯主要分為兩個部分。或者說我們可以想象,海外的云廠商要進行組網,是通過兩個階段實現的:第一個是scale up。
這個scale up怎么理解?比如英偉達之前的A100以及H100的GPU,都是以八張GPU組成一個小型集群,再把這些服務器通過柜外連接,組成超大規模的數據中心。單臺服務器內部的GPU互聯,我們就可以看作是scale up,它原本就要把服務器里面的GPU連接成一個整體,服務器之內的互聯就是scale up。我們從scale up的發展來看,單集群內的GPU數量在不斷地增加。目前來看,單柜GPU數量已經增加到72卡,后續本次發布的576卡機柜將進一步刷新單機柜算力規模。這也是剛剛提到的,我們在GTC大會上看到的核心發布內容。
Scale out是什么?就是要把這些服務器或者機柜組成一個超大規模的整體,只有組成完整的大規模集群、搭建起超大型數據中心之后,才能開展AI的訓練以及推理工作。從目前來看,海外頭部的云廠商,已經建成了十幾萬卡的GPU集群,整體發展速度非常快。
那么我們在實現scale up和scale out的互聯時,有哪些可用的技術方案?第一個是PCB,可能有的朋友知道PCB是什么。大家如果在家拆過鬧鐘或者其他電器,就會知道里面基本都會有一塊PCB。PCB就是印刷電路板,被稱作電子元器件之母,其核心作用就是讓電路能夠更高效、更穩定地運行。當然,不同PCB之間的規格差異極大,比如我們家里鬧鐘里面用的PCB,一平方米可能也就100多塊錢。
但是像英偉達這類企業,或是其他云廠商,用于GPU計算芯片的PCB,規格都非常高:基材目前基本都在M8級別,后續還會向M9甚至M10的材料迭代;層數也很高,普遍能達到二三十層,還帶有一次DI的相關設計。所以AI場景所用的PCB單價極高,部分產品一平方米能賣到幾萬塊錢,甚至更高。
所以我們可以看到,相關PCB企業的業績成長得也非常迅猛,從市場規模來看,也在快速地擴大,目前整個行業產能都處于供不應求的狀態。大家可以看到,很多廠商目前都在快速地擴產,后續產能釋放之后,對相關廠商的業績提振是比較樂觀的。當然這里只是給大家做行業情況的分析列示,不做任何個股推薦。
第二種備選的互聯方式是銅連接。大家可以看到,我列示了英偉達機柜背面的實拍情況,機柜背面這些銀白色、一捆一捆的部件,就是英偉達目前在NVL72機柜中所用的銅纜,整體用量非常大。
![]()
資料來源:Nvidia
這些銅纜的作用是什么?大家可以看下方的示意圖,英偉達的機柜內部是一個個獨立的托盤,每個計算托盤里放置4個GPU,一個機柜內有18個計算托盤,所以總共有72張GPU。計算托盤內部的GPU,主要通過PCB來連接。從內部結構來看,這個結構就相當于一個托盤,每個托盤里有兩個超級芯片,每個超級芯片上搭載兩個GPU,下方藍色的部分就是兩塊PCB,也就是我們剛剛提到的高規格PCB。這里我們可以看到,PCB將4個GPU組成了一個完整的計算托盤。
![]()
下一步,就是要把所有的計算托盤,組成一個完整的機柜整體。而機柜內部的跨托盤互聯,就是靠銅纜來實現的。基本就是通過銅纜連接NV Switch芯片,從而把機柜內所有72張GPU組成一個完整的互聯整體。
![]()
資料來源:Nvidia
但是銅纜也有自身的技術局限。比如目前單層網絡下,用銅纜組成72卡集群已經接近物理極限,如果再疊加一層網絡,最多也只能擴展到576卡,且這還只是技術層面的設想,未必能完全實現。因為銅本身存在諸多物理限制,我們知道銅是導體,而當下數據中心的功耗極高,功耗高的核心原因,是計算芯片的計算吞吐量極大,數據傳輸過程中的運算量極高,傳輸的電流更大、信號頻率也更快。
![]()
資料來源:Nvidia
如果用銅纜承擔數據傳輸任務,極有可能出現過度發熱的問題。持續發熱就意味著能量損耗,長時間工作還會引發數據丟失等問題,這在AI訓練與推理場景中是絕對無法容忍的。為什么?我們以訓練為例,AI模型需要通過一次次的迭代,不斷尋找到最優的參數集合,如果每次迭代都丟失一部分數據,最終很可能導致整個訓練過程完全無效。所以銅纜的核心問題就在這里:它只能支持短距離的連接,傳輸距離過長就無法滿足需求。從目前來看,銅纜最多只能支持幾米的傳輸距離,而英偉達的互聯網絡已經升級到800G通信規格,后續還會進一步向1.6T升級,銅纜的局限性會持續凸顯。
當然,在英偉達機柜規格持續提升的過程中,柜內互聯的整體市場規模也在不斷擴大。在這個擴容的過程中,我們認為無論是PCB還是銅纜,后續都能獲得可觀的市場份額。但如果要讓它們承擔柜內全部的互聯任務,尤其是本次發布的576卡機柜的互聯需求,僅靠銅和PCB在技術上存在不小的難度。后續隨著Feynman芯片的量產落地,將正式引入CPO技術,同步推進柜內可插拔光模塊等光互聯方案的落地應用。
柜外的互聯要如何實現?從英偉達的方案來看,其目前所用的網絡架構,主要是葉脊網絡。什么叫葉脊網絡?大家可以看下方的拓撲圖,葉脊網絡的架構其實很簡單,看起來就像一棵樹,從樹根不斷長出更多的樹枝,樹枝再進一步分化出更細的枝丫,最終連接到葉片,就是這樣的架構。
![]()
注:以上為根據英偉達資料推論所得,具體應用網絡會在客戶間有一定差異
葉脊網絡的邏輯就是如此,比如我們假設有四個輸入端口,中間設置兩臺交換機,從這個架構來看,最基本的要求,就是任意一個輸入端口到任意一個輸出端口之間,至少要有一條通信通路。
而所有的交換機不僅承擔輸入功能,也承擔輸出功能,如果我們把上面的拓撲圖沿中線對折,就形成了英偉達所用的網絡架構。大家可以看到,最上層是脊交換機,把下層的葉交換機連接成一個整體,葉交換機再進一步連接大量的GPU,最終組成數據中心的完整集群。
這個架構中需要用到大量的光模塊。光模塊的應用場景在哪里?大家可以看到,拓撲圖里標注的這些線路,其實都是光纜,而交換機側和服務器側處理信號時,用的都是電信號。所以信號要從一臺交換機傳輸到另一臺交換機,或是從一臺服務器傳輸到另一臺服務器,傳輸過程中需要多次完成光電轉換,而這個核心功能,就是由光模塊來實現的。
我在這里給大家做了相關測算:在三層網絡架構下,GPU與光模塊的配比大約是1:6。當然這里是用同規格的光模塊進行測算的,比如在Hopper架構芯片下,1:6的配比對應的是400G光模塊;在Blackwell架構芯片下,1:6的配比對應的是800G光模塊;下一代Rubin架構,對應的則是1.6T光模塊。當然大家也知道,光模塊有很強的靈活適配性,兩個800G的光模塊可以合并當作一個1.6T的光模塊使用,一個1.6T的光模塊也可以拆分成兩個800G的光模塊使用。所以這個配比在實際產品應用中可能會有小幅波動,但整體對應的帶寬需求是固定的,因此三層網絡下的配比基本維持在1:6左右。
由此可以看到,隨著下游芯片的快速放量,光模塊的整體市場規模會迎來快速增長。后續來看,“光入柜內”會是整個市場預期最高的發展方向之一。為什么會有光入柜內這樣的預期?剛才我已經給大家介紹過,實現scale up和scale out互聯的技術方案,目前只有三種:銅連接、PCB,以及光模塊。目前在英偉達的技術體系中,scale up對應的柜內互聯,全部通過電連接實現,也就是銅纜和PCB;而柜外的長距離互聯,基本都通過光模塊來實現。
往后面去看,正是因為Scale Up在不斷地擴張,我們可以看到從8卡到72卡再到576卡,甚至后續規模可能會越來越大、覆蓋的卡量越來越多。隨著GPU的數量在不斷地增加,對應的部署空間也在不斷地擴大,對吧?所以大家可以看到,比如本次發布的576卡的機柜落地后,所需的部署空間就已經非常可觀了。
對于這么大的部署空間而言,不管是PCB還是銅纜,都會存在自身的固有局限。比如說PCB無法制造得過大,不可能做出一間屋子那么大的PCB板,因為其內部尤其是多層板的壓合工藝,會受到諸多機械條件的限制。而銅纜則受自身物理特性的限制,無法實現長距離的信號傳輸。所以其實在scale up市場規模持續擴大的過程中,光技術后續很有可能會成為核心選擇。
在scale up規模持續擴大的過程中,我再強調一下:scale up的市場規模在不斷擴張的過程中,首先PCB的成長性是比較強的。不管是本次發布的Rubin Ultra采用的正交背板,還是其技術持續升級、層數不斷增加,亦或是所用材料的性能持續提升,PCB的成長性都十分強勁。我只是想說明,在scale up規模持續增長的過程中,PCB與銅纜很難獨自承接市場的全部份額。所以往后面去看,光技術會是非常重要的選擇。
那么scale up這個市場到底有多大?從目前來看,即便我們給大家做相關測算,結果也并不具備足夠的參考性。但從博通CEO的表述來看,該市場規模有5到10倍的增長空間。雖然產業鏈上有5到10倍的增長預期,但各家公司可能都有自身的發展訴求。從我們目前的觀察來看,該市場規模至少會超過柜外市場。
對于當前的可插拔光模塊廠商而言,對應的市場機會大概是怎樣的?我們知道,當前的scale out市場,大致可以理解為柜外市場,已經是可插拔光模塊的核心主戰場。而后續的scale up場景中,采用的可能是可插拔光模塊,也可能是CPO。但無論是可插拔光模塊還是CPO,對于當前的行業龍頭廠商而言,都有充足的訂單機會可以承接。即便是CPO,也有諸多相關方案正在驗證階段,后續有望拿到大量訂單,所以大家也不用過度擔心。
總體從產業層面來看,算力、存力、運力仍在快速地成長。在這樣的發展過程中,相關廠商都將迎來更多的成長機會。
長期來看,AI行業發展遠未觸頂,2026年全球AI資本開支預計超7000億美元,Agent技術進入規模化商用元年,產業成長空間全面打開。投資層面,核心推薦通信ETF國泰(515880),光模塊、服務器等算力核心權重超75%,2025年漲幅居全市場ETF首位;半導體設備ETF國泰(159516)受益于全球存儲擴產與國產替代雙重邏輯,具備充足業績彈性。同時短期布局需警惕美聯儲貨幣政策不確定性、大宗商品漲價推高運營成本等潛在風險。
風險提示:
投資人應當充分了解基金定期定額投資和零存整取等儲蓄方式的區別。定期定額投資是引導投資人進行長期投資、平均投資成本的一種簡單易行的投資方式。但是定期定額投資并不能規避基金投資所固有的風險,不能保證投資人獲得收益,也不是替代儲蓄的等效理財方式。
無論是股票ETF/LOF基金,都是屬于較高預期風險和預期收益的證券投資基金品種,其預期收益及預期風險水平高于混合型基金、債券型基金和貨幣市場基金。
基金資產投資于科創板和創業板股票,會面臨因投資標的、市場制度以及交易規則等差異帶來的特有風險,提請投資者注意。
板塊/基金短期漲跌幅列示僅作為文章分析觀點之輔助材料,僅供參考,不構成對基金業績的保證。
文中提及個股短期業績僅供參考,不構成股票推薦,也不構成對基金業績的預測和保證。
以上觀點僅供參考,不構成投資建議或承諾。如需購買相關基金產品,請您關注投資者適當性管理相關規定、提前做好風險測評,并根據您自身的風險承受能力購買與之相匹配的風險等級的基金產品。基金有風險,投資需謹慎。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.