文 | 多空象限
大模型越用越便宜的神話,在一輪又一輪漲價(jià)公告中宣告終結(jié)。
短短四天之內(nèi),阿里云連發(fā)三條產(chǎn)品漲價(jià)公告:4月13日,DataWorks取消每日API調(diào)用次數(shù)限制,標(biāo)準(zhǔn)版免費(fèi)額度調(diào)整為10萬次/月,超出部分按量付費(fèi);4月15日晚,百煉部分模型單元服務(wù)價(jià)格上調(diào)2%至5%不等;同日,DDoS高防彈性95定價(jià)從100元/Mbps/月調(diào)整為150元/Mbps/月。而這已是阿里云一個(gè)月內(nèi)的第二次漲價(jià)——3月18日,其AI算力、文件存儲(chǔ)等產(chǎn)品最高漲幅已達(dá)34%。
![]()
海外的漲價(jià)更為隱蔽但同樣深刻,Anthropic調(diào)整了旗下Claude Enterprise訂閱模式:從每月每用戶最高200美元的固定費(fèi)用,轉(zhuǎn)變?yōu)槊吭?0美元基礎(chǔ)費(fèi)加上按照實(shí)際算力消耗計(jì)費(fèi)。對(duì)于重度用戶而言,新定價(jià)可能導(dǎo)致成本翻倍甚至三倍。
這一輪漲價(jià)遠(yuǎn)非一次簡單的成本傳導(dǎo),有人用“硅基通脹”一詞來形容新型工業(yè)血液的價(jià)值重估,從這個(gè)角度來看,漲價(jià)的趨勢也很難就此打住。算力正在從“可無限獲取的公共資源”轉(zhuǎn)變?yōu)椤靶韪們r(jià)獲取的戰(zhàn)略資產(chǎn)”,定價(jià)權(quán)正在從應(yīng)用層向基礎(chǔ)設(shè)施層遷移。誰掌握算力,誰就掌握AI時(shí)代的鑄幣權(quán)。
為什么越用越貴?
2026年以來,全球算力需求增長曲線變得越發(fā)陡峭,據(jù)全球最大的API聚合平臺(tái)OpenRouter數(shù)據(jù),2026年4月其周度累計(jì)Token消耗量較一年前提升約7-8倍。國家統(tǒng)計(jì)局今天(4月16日)發(fā)布會(huì)上的最新數(shù)據(jù)顯示,截至今年3月,日均詞元(Token)調(diào)用量突破140萬億,比上年末增長超40%。
中信證券在研報(bào)中指出,Token調(diào)用量井噴帶來的是算力需求極大爆發(fā),與此同時(shí)供給側(cè)受到各類硬約束短期邊際增量有限,目前國內(nèi)外均出現(xiàn)了嚴(yán)重的算力荒。
Agent的興起是算力需求結(jié)構(gòu)最深刻的變革,以O(shè)penClaw為代表的AI Agent,單次任務(wù)消耗Token是ChatBot的10到100倍,國內(nèi)廠商紛紛推出“國產(chǎn)龍蝦”,進(jìn)一步加速了“養(yǎng)蝦”的普及。
關(guān)鍵轉(zhuǎn)變?cè)谟趥鹘y(tǒng)ChatBot產(chǎn)生的算力負(fù)載是間歇性的——用戶提問、模型回答、會(huì)話結(jié)束;而Agent的常態(tài)是持續(xù)運(yùn)行,多步驟推理、信息檢索、代碼執(zhí)行、結(jié)果迭代。這種“常駐負(fù)載”從根本上改變了算力需求的形態(tài)——從請(qǐng)求/響應(yīng)的離散模式,轉(zhuǎn)變?yōu)槿旌虺掷m(xù)的算力消耗。
這種轉(zhuǎn)變也解釋了為什么Agent和多模態(tài)應(yīng)用的爆發(fā)對(duì)推理端算力需求拉動(dòng)極大。中信證券認(rèn)為,AI芯片需求可分為訓(xùn)練和推理,目前推理端算力需求的增長動(dòng)力顯著更強(qiáng)。
這樣看來,傳統(tǒng)產(chǎn)業(yè)經(jīng)濟(jì)學(xué)里的“規(guī)模效應(yīng)”失效了嗎?
傳統(tǒng)SaaS的定價(jià)邏輯建立在邊際成本遞減的假設(shè)之上——用戶越多,單位成本越低。但AI推理的邊際成本結(jié)構(gòu)截然不同,根源在于算力的邊際成本并非算法決定的,而是由物理供應(yīng)鏈決定的。高帶寬內(nèi)存的產(chǎn)能、先進(jìn)封裝的吞吐量、電力供應(yīng)的規(guī)模——這些物理約束在供給側(cè)設(shè)置了剛性天花板,導(dǎo)致“需求越大、成本越高”的現(xiàn)象持續(xù)存在。
誰的產(chǎn)能,誰的壁壘?
算力“荒”的本質(zhì)并非芯片不夠,而是整個(gè)物理供應(yīng)鏈的“木桶效應(yīng)”正在集中顯形。從晶圓到封裝,從內(nèi)存到光模塊,每一個(gè)環(huán)節(jié)都在構(gòu)成一道硬約束。
在AI芯片生產(chǎn)鏈條中,CoWoS先進(jìn)封裝是當(dāng)前最關(guān)鍵的瓶頸。摩根士丹利研報(bào)顯示,臺(tái)積電2026年CoWoS總產(chǎn)能約93kwpm,較2025年底的70k增長33%。但更關(guān)鍵的是,新增產(chǎn)能幾乎被輝達(dá)與博通兩大國際客戶包走,僅部分少量產(chǎn)能分配給聯(lián)發(fā)科。據(jù)臺(tái)媒報(bào)道,臺(tái)積電已全面上調(diào)2026至2027年CoWoS產(chǎn)能目標(biāo),機(jī)構(gòu)推估臺(tái)積電先進(jìn)封裝產(chǎn)能將從今年的130萬片增至2027年的200萬片。即便如此,供給仍遠(yuǎn)遠(yuǎn)無法滿足井噴式的需求。
高帶寬內(nèi)存(HBM)是AI算力另一項(xiàng)核心成本,根據(jù)SemiAnalysis的存儲(chǔ)模型測算,2026年第一季度,LPDDR5合約價(jià)格同比漲幅預(yù)計(jì)將達(dá)約4倍,DDR5合約價(jià)格同比漲幅預(yù)計(jì)將達(dá)約5倍。
AI服務(wù)器的內(nèi)存成本占比正在急劇攀升,一臺(tái)配備8顆H100 GPU的高端AI服務(wù)器,僅HBM內(nèi)存的采購成本就可能占整機(jī)成本的30%以上。當(dāng)內(nèi)存價(jià)格以數(shù)倍的幅度跳漲時(shí),整機(jī)成本被成倍推高。
除了芯片和內(nèi)存,AI基礎(chǔ)設(shè)施中的“毛細(xì)血管”同樣面臨短缺,800G以上光收發(fā)模塊2026年預(yù)計(jì)增至6300萬組,但EML激光器產(chǎn)能被英偉達(dá)等巨頭壟斷,交期已排至2027年之后。Paddle Card等關(guān)鍵PCB組件的交期從正常的6周拉長到6個(gè)月。
SemiAnalysis報(bào)告指出,更高的服務(wù)器采購成本壓縮了項(xiàng)目預(yù)期回報(bào),迫使部分運(yùn)營商放緩甚至擱置新部署計(jì)劃。換言之,原本應(yīng)進(jìn)入市場的新增供給被迫滯后,進(jìn)一步收緊了租賃市場的供給格局。
當(dāng)供給側(cè)每個(gè)環(huán)節(jié)——晶圓、封裝、內(nèi)存、光模塊——都形成寡頭壁壘時(shí),算力就從“可復(fù)制的商品”變成“需排隊(duì)爭奪的稀缺品”。
定價(jià)權(quán)轉(zhuǎn)移下的產(chǎn)業(yè)鏈博弈
漲價(jià)潮最深刻的變革不在于價(jià)格本身,而在于它重新定義了AI產(chǎn)業(yè)鏈中的權(quán)力關(guān)系。
過去十年,云計(jì)算行業(yè)遵循“只降不升”的鐵律——規(guī)模效應(yīng)驅(qū)動(dòng)價(jià)格持續(xù)下行,廠商以低價(jià)獲客、以規(guī)模取勝。然而2026年,阿里云、騰訊云、百度云等頭部廠商集體打破這一慣例。
所謂的定價(jià)權(quán)轉(zhuǎn)移主要體現(xiàn)在三個(gè)層面:
云廠商從“規(guī)模擴(kuò)張優(yōu)先”轉(zhuǎn)向“價(jià)值定價(jià)優(yōu)先”,將稀缺的GPU資源向高毛利的模型即服務(wù)(MaaS)與核心API集中。東吳證券研報(bào)分析,當(dāng)前算力緊缺下,算力租賃廠商的議價(jià)權(quán)有望提升,其業(yè)務(wù)正從單純的裸算力出租升級(jí)為模型服務(wù)或Token分成模式,即從“賣算力”轉(zhuǎn)向“賣詞元”。
大模型廠商的商業(yè)模式也在發(fā)生根本性轉(zhuǎn)變,智譜年內(nèi)三次提價(jià),整體漲幅超60%。Anthropic從固定訂閱轉(zhuǎn)向按量計(jì)費(fèi),標(biāo)志著大模型公司從“燒錢換增長”向“精細(xì)化運(yùn)營”的轉(zhuǎn)型。
硬件廠商是這輪漲價(jià)的最大受益者,SemiAnalysis數(shù)據(jù)顯示,部分2至3年前簽署的H100租賃合約,正以原價(jià)完成續(xù)約,有的合約甚至直接續(xù)約4年至2028年。一款2022年發(fā)布的芯片,在四五年后仍能以原價(jià)鎖定長期租約——這在半導(dǎo)體行業(yè)歷史上極為罕見。
誰在承受成本壓力呢?
重度用戶是這場漲價(jià)中最直接的“受害者”,Anthropic新定價(jià)模式下,重度用戶的成本可能翻倍甚至三倍。
開發(fā)者與中小企業(yè)正在面臨“算力鴻溝”的擠壓,國內(nèi)模型廠和云平臺(tái)紛紛下調(diào)Coding Plan的額度和優(yōu)惠,智譜等廠商的Coding Plan產(chǎn)品出現(xiàn)了限購現(xiàn)象。
二線云廠商與大模型公司同樣承壓,僅有頭部云廠商能夠獲得較為充足的先進(jìn)算力資源,中小型廠商在算力爭奪中處于明顯劣勢。
在此背景下,算力正在制造新的社會(huì)分層。頭部科技公司鎖定長期協(xié)議和先進(jìn)產(chǎn)能,享有穩(wěn)定的算力供給和相對(duì)有利的價(jià)格;中小企業(yè)只能按小時(shí)租賃、按Token付費(fèi),在供需波動(dòng)中承受更大的成本壓力。
國產(chǎn)替代的加速窗口
算力短缺不僅帶來漲價(jià),也為國產(chǎn)算力產(chǎn)業(yè)鏈創(chuàng)造了歷史性機(jī)遇。中信證券明確判斷,AI應(yīng)用爆發(fā)對(duì)應(yīng)的國內(nèi)算力荒將會(huì)加速國產(chǎn)卡放量,預(yù)計(jì)2026年國產(chǎn)算力芯片出貨量至少實(shí)現(xiàn)翻倍以上增長,將為算力設(shè)計(jì)公司、先進(jìn)制程、先進(jìn)封裝、先進(jìn)存儲(chǔ)以及配套產(chǎn)業(yè)鏈帶來強(qiáng)勁增長動(dòng)能。
據(jù)IDC數(shù)據(jù),2025年中國AI加速卡出貨量約400萬張,其中國產(chǎn)AI加速卡出貨量165萬張,市場份額約41%。華為出貨量約81萬張,市場份額約20%,已與英偉達(dá)形成實(shí)質(zhì)性競爭格局。
![]()
在英偉達(dá)新的AI加速卡恢復(fù)對(duì)華銷售之前,中國國產(chǎn)AI加速卡廠商有望持續(xù)替代英偉達(dá)的市場份額。
從推理端切入國產(chǎn)替代的邏輯同樣清晰,中信證券分析指出,推理環(huán)節(jié)對(duì)算力產(chǎn)品綜合性能要求相較訓(xùn)練端任務(wù)更低,國產(chǎn)算力芯片廠商通過與互聯(lián)網(wǎng)廠商深度合作(針對(duì)特定需求定制化或優(yōu)化),能夠提供更適配需求的推理芯片,國產(chǎn)替代節(jié)奏相較于訓(xùn)練端進(jìn)展更快。
國產(chǎn)算力產(chǎn)業(yè)正形成多強(qiáng)并驅(qū)的格局,除華為外,寒武紀(jì)計(jì)劃在2026年交付50萬件AI加速器,其中包含多達(dá)30萬件最先進(jìn)的思元590和690芯片,并計(jì)劃將其芯片產(chǎn)量提高兩倍以上。海光信息新一代芯片性能約為H100的45%,2026年計(jì)劃量產(chǎn)近30萬顆。
中銀國際證券在研報(bào)中稱,“十五五”規(guī)劃建議明確提出“適度超前建設(shè)新型基礎(chǔ)設(shè)施”,算力不再僅僅是技術(shù)圈的專業(yè)議題,而是上升為國家戰(zhàn)略層面的核心競爭力。
結(jié)語
短期內(nèi),供需緊張的格局難以根本緩解。大摩預(yù)測2026年CoWoS產(chǎn)能僅增長33%,而Token消耗量同比已增長7-8倍——產(chǎn)能增速遠(yuǎn)落后于需求增速。關(guān)鍵問題集中在AI需求可能出現(xiàn)的問題以及除NVIDIA外的投資標(biāo)的。當(dāng)定價(jià)權(quán)加速向上游集中時(shí),產(chǎn)業(yè)鏈的投資邏輯也在同步重構(gòu)。
中長期來看,這輪漲價(jià)潮最深遠(yuǎn)的影響,可能在于AI產(chǎn)業(yè)成本結(jié)構(gòu)的轉(zhuǎn)變。
從“訓(xùn)練昂貴、推理便宜”到“訓(xùn)練平價(jià)、推理昂貴” 。隨著模型架構(gòu)創(chuàng)新和訓(xùn)練效率提升,訓(xùn)練成本在持續(xù)下降;但推理環(huán)節(jié)因Agent常駐負(fù)載和多模態(tài)交互的普及,正成為算力消耗和成本的核心來源。這意味著未來AI商業(yè)模式的盈利模型需要重新設(shè)計(jì)。
“算力效率”成為核心競爭力,當(dāng)Token本身成為計(jì)價(jià)單位,如何降低每次交互的Token消耗、優(yōu)化推理效率,將成為繼模型能力之后企業(yè)競爭的第二條核心賽道。
參考資料
[1]Token量井噴導(dǎo)致算力荒,國產(chǎn)算力在推理端加速突圍,中信證券
[2]電子行業(yè)國產(chǎn)算力全面突破:從芯片替代到系統(tǒng)架構(gòu)創(chuàng)新,中銀國際證券
[3]算力告急!SemiAnalysis深度解讀:從GPU到內(nèi)存再到光纖,AI供應(yīng)鏈全線緊繃,華爾街見聞
[4]算力漲價(jià)潮席卷全球!阿里、Anthropic連續(xù)調(diào)價(jià) 嚴(yán)重算力荒再現(xiàn),財(cái)聯(lián)社
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.