文 | 強調Next
明天(4月18日),阿里云、百度智能云將正式開始調價。3周之后,騰訊云也將迎來新一輪漲價。全球范圍內,OpenAI、Anthropic在過去18個月里把API價格降了超過80%,DeepSeek-R1的出現更讓外界相信推理成本即將歸零。
結果,中國三大云廠商在同一周宣布漲價20%至30%。
![]()
媒體的第一反應是“價格戰結束,大廠開始收割”。這個定調不算錯,但它停在了最表層的解讀上。它解釋了云廠商為什么要漲,卻沒有回答更關鍵的問題:這次漲價是短暫修正,還是一個持續性趨勢的起點?答案,藏在一個150年前的經濟學悖論里。
01.杰文斯悖論:越便宜,燒得越兇
1865年,英國經濟學家威廉·杰文斯觀察到一個反直覺現象:蒸汽機效率提升之后,英國的煤炭消耗總量反而急劇增長:效率提升降低了使用成本,觸發了需求爆炸。這就是杰文斯悖論(Jevons Paradox),它在2026年的算力市場里精準復現了。
DeepSeek-R1確實讓單Token推理成本大幅下降。但它同時打開了一個需求閘門:大量此前覺得“AI太貴”的企業,開始把AI嵌進業務流程。一旦嵌入,Token消耗量以非線性速度膨脹。
更關鍵的變化是,AI的應用已經從“對話”進入“做事”:Agent和Reasoning Model登場了。一個任務以前燒1000個Token,接上思維鏈之后燒5000個,因為Reasoning Model會自己“思考”,消耗量是普通模式的10到50倍。
![]()
DeepSeek降低了起步門檻,卻捅破了算力天花板。每一單位Token越來越便宜,但每一個業務任務卻越來越貴。這才是這輪漲價得以成立的真實地基。
02.開源了權重,沒開源推理棧
另一個被大量報道忽略的細節:DeepSeek開源了模型權重,但沒有開源它的推理優化棧。這兩者的差別,好比給你了發動機的設計圖紙,卻沒告訴你怎么調出F1的性能。
真正決定推理成本的,不只是模型架構,而是藏在水面下的工程能力:投機解碼(Speculative Decoding)的命中率、KV Cache的內存調度策略、Prefill與Decode階段的分離優化、萬卡集群的網絡拓撲。這些硬功夫,仍然是少數頭部云廠商的護城河。
![]()
同樣跑DeepSeek-R1,頭部云廠商的推理效率可以比企業自建高出3到5倍。這意味著同等算力投入下,云廠商能服務更多并發,單位成本更低。
這個效率差,就是云廠商“溢價”的來源之一。它是實實在在的工程壁壘。所以這次漲價,某種程度上也是在給自己的技術優勢定價。
03.諸神之戰:四家巨頭的賬本與野心
在這一輪集體調價的浪潮中,四家核心巨頭的姿態各異,折射出不同的商業算盤。
阿里云:吳泳銘式的“利潤質量”保衛戰。阿里的調價最堅決,漲幅主要集中在高端GPU實例和存儲(CPFS)上。在阿里全面回歸“效率第一”的背景下,阿里云不再追求所謂的“云市場份額第一”,而是要搶奪“AI算力利潤率第一”。潛臺詞就是,阿里云正在建立一個“VIP算力區”。如果你無法覆蓋這30%的溢價,你可能就不在阿里的核心目標客戶名單上。
百度智能云:“用戶過濾器”。百度作為最早押注大模型的玩家,正面臨文心大模型推理成本隨調用量量級躍遷的壓力。所以百度的漲價更像是一場“用戶洗牌”。它在主動洗掉那些只薅羊毛、不產生商業閉環的小型個人開發者,轉而全力服務對價格不敏感的B端大客戶。百度需要通過調價證明:它的AI增長不再靠補貼,而是靠“溢價賣智力”。
騰訊云:生態鎖死后的“ROI修正”。騰訊云的動作比阿里晚了三周,這是一種典型的“跟隨策略”。騰訊的底氣在于微信生態和企業微信的深度綁定。當企業的工作流已經深度嵌入騰訊的社交/協同生態,遷移成本極高。騰訊云的漲價更像是一種“補漲”,用來修正過去兩年為了搶占生態而犧牲的ROI,讓AI業務在財報里變得更“體面”。
火山引擎:戰略性“不平衡跟隨”與搶人計劃。火山引擎(字節跳動)是這波漲價潮中的變數。它雖然也調整了部分價格,但在很多核心API上的漲幅明顯低于阿里和百度。字節正在利用這個窗口期進行“存量截流”。憑借內部抖音、TikTok帶來的恐怖算力消納能力,火山擁有極強的成本攤薄底牌。當對手在“趕客”保利潤時,火山在等那些掉隊者,試圖通過價格差完成最后一次“裝機量”的反超。
04.最大的意外:大企業開始"出走"
這次漲價引發了一個沒人預料到的反作用力:它實質上堅定了大企業“自建算力”的決心。
云計算行業有個隱藏規律:當月度賬單突破某個閾值,“自建 vs. 租用”的財務模型就會翻轉。對于銀行、央國企、大型制造商來說,這個閾值大約在每月300萬到500萬元的云算力支出。
2024年,大多數大型企業還在閾值以下,自建劃不來。2025年隨著AI項目鋪開,部分企業開始觸線。而2026年這輪20%到30%的漲價,直接把一批原本剛好卡線的客戶,推到了“必須認真考慮自建”的區間。
![]()
這波自建潮的受益者并不是云廠商的競爭對手,而是更邊緣的角色:GPU租賃平臺的3月詢價量同比翻了兩倍;華為昇騰的大客戶交付排期已拉長到6個月;專門幫企業做"私有化推理集群"的集成商突然成了香餑餑。
云廠商本來打算漲價收割高端客戶,沒想到順手推走了一批有自建能力的大客戶。這個決策風險,在財報季到來時可能會被重新評估。
![]()
05.誰贏了?利益分配的真相
三家云廠商的漲價,在媒體眼里是“大廠收割”。但從整個產業鏈來看,真正的贏家分布要復雜得多。
![]()
這里有個諷刺的現實:最受傷的是那些最有創新活力的中小AI創業公司。他們如果因為成本大面積倒下,云廠商自己的生態也會隨之枯萎。
這不是沒有先例。2010年代初期,亞馬遜AWS在某些服務上的激進漲價,加速了部分開發者轉向Google Cloud,間接幫助GCP完成了早期生態積累。歷史不會簡單重復,但它會押韻。
06.漲價時代,還要持續多久?
說穿了,這輪漲價的本質是中國AI算力市場在需求爆發與供給約束之間的一次壓力釋放。兩邊擠壓之下,價格只能向上走。這不完全是云廠商的主動選擇,某種意義上也是被迫的定價修復。
![]()
支撐這輪漲價的三個結構性因素,沒有一個會在12個月內實質性消失:Reasoning模型普及帶來的Token消耗量級躍遷、AI Agent大規模落地加速、以及Nvidia出口管制帶來的供給約束。
B2B軟件市場有一個反復驗證的規律:價格棘輪效應(Ratchet Effect)。AWS在2010年代初的幾次漲價,沒有一次在供給改善后完整回吐。Google Cloud存儲定價自2021年以來只走過一次下行臺階,還附帶了存儲上限收緊。云廠商懂這個規律:這次漲價不只是“趁窗口收割”,更是在鎖定一個新的價格基準線。
![]()
![]()
所以在2027年之前,“算力歸零”不會成真。真正決定價格拐點的,取決于國產算力的調度效率什么時候能實質性追上Nvidia H100。從目前的工程進度來看,這個時間點大概率在2027年至2028年之間。
而在這個窗口里,云廠商有充分的理由“先漲為敬”,因為他們知道,窗口不會永遠開著。
07結語:一場供給側的結構性博弈
這輪漲價揭示的,不是“AI商業化成人禮”這種宏大敘事,而是一個更具體的產業現實:效率革命與需求爆炸同步發生時,價格不一定下行,反而可能上行。杰文斯悖論在煤炭時代成立,在算力時代同樣成立。
對中小AI應用企業來說,與其爭論誰在收割,不如認真算一筆賬:自己的業務場景里,還有多少Token在被無效消耗?
省Token,才是這個時代最硬的護城河。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.