2026年3月下旬,全球存儲芯片板塊突發集體回調,市場情緒迅速轉向恐慌。而投資者紛紛將矛頭指向谷歌最新發布的AI內存壓縮技術“TurboQuant”,認為這一“黑科技”將大幅降低內存需求,從而重創存儲企業基本盤。然而,當我們冷靜觀察后不難發現,此次下跌并非技術顛覆所致,而是存儲行業邁入新周期的正常調整,技術進步只是表象,AI算力驅動下的結構性需求才是核心。
![]()
存儲芯片板塊集體下挫:都是谷歌TurboQuant惹的禍?
2026年3月下旬,全球存儲芯片板塊遭遇罕見回調。例如A股方面,佰維存儲盤中一度跌超6%,兆易創新、江波龍等跟跌超3%-5%;美股市場更顯劇烈,美光科技連續多日下跌累計超15%,閃迪(SanDisk)一度重挫超11%,西部數據、希捷科技等存儲巨頭同步走弱;韓國三星電子、SK海力士股價分別下滑近5%和6%以上。
由此市場情緒迅速轉向恐慌,而主流媒體和投資者幾乎都將矛頭直指谷歌最新公布的AI內存壓縮技術—TurboQuant。
那么問題來了,TurboQuant究竟是何方神圣?
據谷歌研究團隊介紹,TurboQuant是一種無需重新訓練模型的壓縮算法,主要針對大語言模型和向量搜索引擎中用于存儲高頻訪問信息的鍵值緩存(KV Cache)。它能將KV Cache壓縮至3bit精度,在Gemma、Mistral等開源模型上實現約6倍內存壓縮效果,同時保持模型準確率基本不受影響,甚至在英偉達H100GPU上實現最高8倍的性能加速。
![]()
值得注意的是,TurboQuant的壓縮范圍嚴格限定在推理階段的KV Cache,用于緩解超長上下文和高并發場景帶來的顯存線性增長問題,而并不壓縮模型權重本身對HBM的占用。這意味著,它并不能改變千億參數大模型在部署時對底層硬件容量的基本門檻,而更多是優化“單位內存可以承載的推理請求量”。
針對于此,業內解讀迅速發酵,大體邏輯是:AI系統內存需求或大幅降低,DRAM、HBM等存儲芯片的長期需求預期遭到沖擊。與此同時,多家投行和自媒體甚至直呼“谷歌黑科技干掉存儲需求”,疊加前期板塊高位獲利了結,拋售潮一觸即發。
表面上看,這似乎是技術進步對傳統存儲產業的“降維打擊”,但這種線性推導忽略了一個更關鍵的問題,即需求是否真的會因為效率提升而下降?如果稍微拉長時間維度,就會發現這輪存儲股價回調,并不是從谷歌發布技術的那一刻才開始的。
在此之前,市場已經出現了一些更為基礎的變化,比如部分DRAM品類的價格上漲動能減弱,下游廠商對繼續提價的接受度下降,甚至開始拒絕漲價,直至目前有些降價情況也已出現。與此同時,一些智能手機廠商已經在調整產品策略,減少中低端機型的投放,因為在當前成本結構下,繼續推新自然變得不劃算。
例如,2025年末至2026年初,部分廠商已開始縮減中低端DDR、NAND配置,以應對終端價格剛性與上游成本高企的矛盾。而這種“溫和但持續”的調整,最終反映到存儲采購,為市場情緒的轉變埋下伏筆。
需要說明的是,這些信號本身,并不具備“新聞性”,卻恰恰是存儲行業最關鍵的風向標。畢竟對于熟悉這一行業的投資者來說,真正重要的從來不是某項技術突破,而是買方態度的變化。當下游開始不再恐慌性囤貨,當價格從“必須接受”變成“可以談判”,周期的拐點往往已經悄然出現。
谷歌技術并非顛覆:邏輯在存儲市場周期性調整
如果把視角從前述的短期情緒抽離出來,就會發現存儲行業,再一次走到了周期切換的臨界點。而作為一個高度標準化的行業,DRAM和NAND從來都不是靠技術差異定價的產品,它們更像是半導體產業的“大宗商品”,價格的每一次波動,幾乎都直接映射供需關系的變化。
也正因為如此,這個行業在過去幾十年里反復上演著類似的橋段:價格上漲帶來利潤擴張,廠商加大資本開支,產能在兩到三年后集中釋放,供給迅速超過需求,價格回落甚至崩塌,然后進入下一輪收縮與復蘇。這樣的循環之頻繁,以至于市場習慣用“豬周期”來形容它,即當所有人都因為高價而選擇擴產時,真正的風險其實已經在路上。某種意義上,存儲行業從來不是被技術打敗,而是被自身周期反噬。而當前這輪回調,正是這種機制的延續。
眾所周知,過去兩年,在AI需求的帶動下,存儲價格快速上漲,廠商的擴產意愿明顯增強,而與此同時,部分傳統需求端其實并沒有同步跟上。尤其是在智能手機和PC領域,需求恢復的節奏遠低于預期,而當成本端持續上行、終端價格難以轉嫁時,廠商只能通過減少配置、延緩換代甚至縮減產品線來應對,這種“溫和但持續”的調整,最終會反映到存儲采購上。
在這樣的背景下,再回頭看谷歌的TurboQuant無疑就理性了許多。
谷歌在論文與技術說明中提到的TurboQuant主要創新點包括:通過自研控制器和AI數據壓縮算法提升SSD利用率;在數據中心層面引入分級存儲體系(Tiered Storage),更智能地匹配冷熱數據訪問;結合近似計算模型(ApproximateComputing)來權衡精度與能效。
上述技術路線看似新穎,但若從產業演進角度看,無非是“控制算法+Tiering+能耗優化”的延續版本。IBM、Meta、阿里云在三年前都進行過類似嘗試。換言之,谷歌的TurboQuant并不是一場真正的新技術革命,而是一種平臺級的系統優化,它會提升谷歌自有數據中心的效率,卻不會沖擊整個存儲芯片產業鏈。
對此,摩根士丹利等機構也明確指出,TurboQuant僅作用于推理KV Cache,不影響模型權重HBM,也不涉及訓練任務;相反,效率提升將放大單GPU吞吐量,支持更長上下文和更大批處理,反而可能間接刺激硬件采購。
![]()
更具體地看,在推理場景中,TurboQuant通過6倍壓縮比大幅降低單GPU的KV緩存占用,相當于變相提升了GPU能處理的并發請求數量,使HBM在高并發、長上下文場景下的帶寬優勢能夠更充分釋放。短期內,這可能改變部分云廠商對“單位算力所需內存”的規劃,但并不會消除對HBM、DRAM等高端存儲的長期依賴,反而會強化其在高端AI服務器中的不可替代性。
由此可見,資本市場的過度解讀,往往來自對“技術創新”和“產業周期”混淆的誤判。短期看,技術新聞可能影響預期;中期看,決定股價走勢的仍是周期規律。故2026年初的這一輪調整,與其說是對谷歌TurboQuant技術的反應,不如說是對此前存儲過熱預期的一次自我校正。
與此同時,我們還觀察到一個非常典型的市場信號,那就是雖然股價下滑,但主要存儲廠商的資本支出計劃并未收縮。
例如SK海力士宣布仍將推進HBM4的開發,并計劃在2026年及之后繼續擴大HBM產能,預計2026年底月產能將達到約20萬片TSV晶圓水平;三星也將HBM4列為重點,逐步推進擴產節奏;美光則在2026財年將資本支出上調至約200億美元,重點投向先進DRAM和HBM產線,全年HBM產能已被下游客戶預訂一空。
![]()
上述種種事實說明,廠商自己并不認為這是結構性的衰退,而是階段性的調整,甚至從某種意義上,這種“下跌”反倒是下一輪周期啟動的前奏。
AI算力驅動下存儲需求高漲:HBM供需失衡與杰文斯悖論
如上述,如果是下一輪周期啟動的前奏,與以往幾輪周期相比,這一輪最大的不同,在于需求側正在發生結構性變化,而這種變化,則很難用傳統周期模型去完全解釋。
原因在于,過去,存儲需求主要來自手機、PC和服務器,它們的增長是漸進式、相對可預測的。而今天,AI正在成為新的需求核心,而且這種需求并非線性增長。具體表現為,一個大型模型訓練任務,所消耗的存儲資源,可能相當于過去成千上萬臺傳統設備的總和;一個超大規模數據中心,在短時間內鎖定的DRAM和HBM產能,足以改變整個市場的供需平衡。而在這一過程中,HBM(高帶寬存儲)逐漸成為關鍵變量。
與傳統DRAM相比,HBM不僅要求更高的帶寬與能效,還高度依賴先進封裝等復雜工藝,這使得供給端的擴張速度遠遠跟不上需求增長。
根據行業數據,2026年底全球主要廠商合計HBM晶圓產能(以TSV晶圓計)仍將處于緊張狀態,美光、SK海力士等廠商產能雖在提升,但大多已被英偉達等頭部客戶提前預訂。
此外,從某種意義上看,HBM已經不再只是存儲產品,而是算力系統的一部分,特別是在AI訓練與分布式推理場景中,HBM的容量與帶寬直接決定了單卡或單機柜的算力上限。事實是,2026年,HBM4將逐步進入商用,單模塊容量有望提升至432GB,配合12層堆疊,內存帶寬可達約19.6TB/s,進一步放大對高端存儲的依賴。
基于此,目前市場的短期麻煩并不在需求消失,而在供給結構受限,主因包括先進封裝產能不足、高層堆疊難度上升以及資本支出周期存在滯后。
以先進封裝為例,HBM需要與GPU通過2.5D或3D封裝技術集成,但臺積電、三星的CoWoS等產線仍處于產能吃緊狀態。例如TSMC CoWoS產能雖從2024年起加速擴產,2025年目標約7.5萬片/月;2026年底或達12-13萬片/月,但英偉達一家就預訂過半,整體仍極度緊張,售罄至2026年。對此,盡管國內廠商如長江存儲、長鑫存儲也在追趕HBM國產化,但短期仍難以填補缺,而這正是當前存儲價格堅挺、股價回調后仍具支撐的根本原因,同時意味著需求遠超供給,瓶頸解除后將釋放更大空間。
![]()
![]()
更重要的是,從更長周期來看,技術進步并不會壓制需求,反而往往會放大需求,而這正是經濟學中著名的杰文斯悖論所揭示的規律,即當某種資源使用效率提升后,總消耗量反而會增加。這是因為效率提升降低了成本,刺激了更廣泛的應用和更密集的部署。
放在存儲產業中,這一邏輯同樣成立,那就是每一次技術優化(無論是更高密度的NAND,還是更節能的HBM),最終都并非讓存儲需求下降,而是讓數據創造和計算變得更普遍、更密集,從而帶來更大的存儲需求總量。
事實是,目前AI算力的發展趨勢正是這一悖論的最好詮釋。眾所周知,OpenAI的多模態大模型、谷歌Gemini、百度的文心、字節的Coze等,這些模型的訓練參數量以指數級增長。而一個百億參數的模型,訓練過程可能需要消耗數百TB的高速緩存與臨時存儲;進入到推理階段后,AI服務的普及又會帶來持續的讀寫和存取需求,從而對高速DRAM與HBM的依賴將愈發顯著。
在這一背景下,TurboQuant這樣的技術優化,雖然能在單個GPU上大幅壓縮KV Cache,但整體效應是以更低的推理成本+更高的并發吞吐,推動更多AI服務上線、更長上下文對話、更復雜的多模態交互,這反過來又會刺激對HBM、DRAM的總需求,而這正是“效率提升放大總需求”的典型場景。
寫在最后:綜上,我們認為,存儲股此次下跌是市場對谷歌“新技術”的誤讀與新周期調整的正常陣痛,而非行業拐點,尤其是在AI算力浪潮下,HBM供需失衡短期會制約供給,長期將隨產能釋放而高漲,而杰文斯悖論則確保效率提升,最終放大而非抑制總需求。
可以說,真正的新周期才剛剛開啟,存儲企業仍將迎來需求與利潤的雙重紅利期。短期看,行業正從“單純提價”進入“結構性供需摩擦”階段,價格和股價波動都可能加大;中長期看,AI算力的持續擴張、HBM產能的逐步釋放以及各類技術優化的疊加,將共同推動存儲在單位算力成本下降的同時,實現整體需求總量的持續攀升。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.