![]()
來源:獵云精選;文/邵延港
有人說:“想搞垮一家AI公司,只需要讓他調用的API接口漲價就行”。盡管這種現象還沒有出現,但作為AI“賣鏟人”的云計算巨頭與大模型廠商已經開始漲價了。
近日,阿里云與百度智能云兩家巨頭同時宣布漲價,對AI算力、存儲等相關產品價格上調,最高漲價幅度超過30%。讓兩家云巨頭在過去持續的“價格戰”中選擇逆行的主要原因,是算力需求持續攀升對核心硬件及相關基礎設施成本造成了巨大壓力。
這并非特例,在此之前,騰訊云智能體開發平臺就已經宣布,將對部分模型的計費策略進行優化調整,大模型廠商智譜也對旗下大模型的API調用價格上調。再往前,今年亞馬遜云、谷歌等國際巨頭已經悄悄漲價。
歸根結底,在AI市場瘋狂活躍的“小龍蝦們” 難辭其咎。
2026年,市場稱為“AI應用元年”,自今年年初以來,一個本地部署的AI智能體OpenClaw,讓用戶看到了AI在工作中的強大能力,普通用戶爭先嘗試,大廠們也陸續跟進,這一輪沖擊不亞于幾年前的ChatGPT。
而AI應用爆發背后,是對云服務器與大模型調用的高度依賴,指數級增長的Token帶來的成本賬單,讓此前靠免費或低價維持用戶的大模型廠商最先感受到壓力,然后傳導致AI算力核心的云服務廠商和大模型服務商。
當前的漲價主要來自短期算力缺口,表象背后是AI逐漸成為剛需生產力,未來不只是企業用戶,專業個人用戶也要為Token買單。
云廠商與AI廠商啟動漲價周期
3月18日,百度智能云官網發布AI算力、存儲等產品調價公告。公告稱,自4月18日起,AI算力相關產品服務價格上調約5%-30%,并行文件存儲等價格上調約30%。
原因是受全球人工智能應用快速發展影響,算力需求持續攀升。核心硬件及相關基礎設施成本出現顯著上漲。為保障平臺長期穩定運行與服務質量,百度智能云對部分產品價格進行結構性優化。
同一日,阿里云官網也發布漲價公告,平頭哥真武810E等算力卡產品上漲5%—34%,文件存儲CPFS(智算版)上漲30%。原因是全球AI需求爆發、供應鏈漲價,行業核心硬件采購成本顯著上漲。
感受到算力成本壓力的,還有騰訊云。
騰訊云此前宣布自3月13日起調整智能體開發平臺部分AI模型的計費策略,本次調整主要涉及兩類變更:模型價格調整與公測模型結束免費。
根據公告,具體安排,一是公測模型結束免費,GLM 5、MiniMax 2.5、Kimi 2.5模型將于3月13日結束免費公測,轉為正式商用服務;二是變更為對混元系列模型Tencent HY2.0 Instruct與Tencent HY2.0 Think服務進行漲價,部分模型漲幅超4倍。
![]()
此外,騰訊云還宣布將于3 月 18 日起將視頻處理、視頻轉碼、綜藝視頻片段拆分等3款插件啟動商業化計費,將從免費提供轉為采用套餐付費模式。
看來在小龍蝦智能體爆火后,Token 消耗翻了四倍多,騰訊云也扛不住成本,此舉也是為了把價格拉回合理區間。
自此,國內三大云巨頭都已經啟動漲價策略,在今年1月,亞馬遜AWS也宣布對用于大模型訓練的EC2機器學習容量塊實施15%的價格上調。同月,谷歌云對CDN Interconnect、Direct Peering等數據傳輸服務價格進行了大幅調整。這與云廠商“價格戰”的市場印象,多少有些出入。
與此同時,大模型廠商也已經調高大模型API調用費用。3月16日,智譜在發布最新大模型的同時,上調了GLM-5-Turbo的API價格,幅度為20%。而在一個月前,智譜也在正式推出新一代旗艦模型GLM-5的第二天上調GLM Coding Plan套餐價格,其中中國區漲價30%,海外版漲價超100%。一個月兩次漲價,讓智譜新一代大模型較上一代產品的漲價幅度達到83%。
自云計算商用以來,不斷降價在用戶看來是物理規律和邊際成本等共同作用的必然結果。大模型也類似,早期憑借低價甚至免費來吸引用戶,在算力效率提升的同時來降低邊際成本。
兩年前,包括阿里云、百度云以及騰訊云等國內主要云廠商紛紛卷入價格戰,行業進入了“以價換量”階段。尤其是彼時大模型正在爆發前期,云廠商需要用價格戰來吸引開發者及企業用戶入駐。
但云廠商的這種默契,被智能體應用突然打破。
AI應用,狂吞算力
一切的元兇就是那只小龍蝦掀起的AI應用普及浪潮。
過去幾年,AI的能力升級有目共睹。從ChatGPT起,市場對人工智能的想象力便逐漸放縱了起來。國內科技產業界也卷入大模型開發中,想要從這個聊天機器人中發掘更多可能,機器人、工作助手、智能搜索等行業都開啟變革。如今OpenClaw的出現再次為人類思維搭上一根筋,AI要真的開始介入普通人的工作了。
據了解OpenClaw可部署在本地設備(如電腦、服務器),支持通過通訊軟件(如微信、Telegram)下達指令,實現自動化任務,如文件管理、郵件發送、網頁操作等。用戶可自定義技能模塊(Skills),賦予AI特定能力,如數據分析、內容創作等。
從技術原理上來看,OpenClaw本身不依賴特定大模型,需接入外部大模型完成指令理解和任務執行。通過“規劃-執行-觀察”循環模式,結合大模型能力實現復雜任務自動化。
這也意味著,以OpenClaw為代表的智能體和眾多AI應用,將大模型帶到推理時代。
與之前的對話式通用大模型不同的是,OpenClaw以任務為導向,通常涉及多輪理解、任務拆解、工具調用、狀態銜接、時間觸發和持續執行的長鏈路工作流。這也讓智能體在實際場景中反復消耗token。
有數據顯示,OpenClaw 用戶的單日人均 Token 消耗量是傳統聊天用戶的 20-50 倍。小龍蝦爆火后,國內 AI 模型調用量自春節后持續飆升,阿里云百煉平臺在 1-3 月創下了歷史最高增速。目前中國主流大模型日均Token從2024年初1000億飆升至2026年180萬億,谷歌月處理超1300萬億,字節、阿里等平臺調用量同比增10倍以上。
因此,以“開源免費”吸引用戶的OpenClaw,實際使用成本卻遠比想象中的要復雜,AI應用的運轉也打開了Token時代的新格局。
AI全民化普及,猛推巨頭策略轉向
在AI應用引發的暫時性算力缺口影響下,云廠商與大模型廠商被迫轉變。
Token,在新一輪的AI潮流中站上了浪尖。Token,即詞元,是大語言模型處理信息的基本單位,即數據進入模型前,經由切分、編碼或量化得到的基本處理單元,如文本子詞和圖片像素方塊。AI每一次接收和處理人類信息,都是背后Token在燃燒。
如今,AI產業已經將Token置于前所未有的地位。
3月16日下午,阿里巴巴宣布成立Token事業群,由CEO吳泳銘直接負責,阿里將全面進軍智能體AI時代。ATH事業群的核心目標就是“創造 Token、輸送 Token、應用Token”為核心目標。
數小時后,英偉達CEO黃仁勛在GTC 2026上也提出了一套Token經濟學,他指出在AI產業中,數據中心正在從訓練模型的地方,變成生產Token的工廠。
若移動互聯網時代數據流量是晴雨表,而AI時代,Token就是風向標。
小龍蝦爆火的背后是專業看到了智能體“干活”的新奇與對高效率渴望。OpenClaw也在中國帶火了一個“蝦圈”,云端、移動端各類蝦層出不窮,騰訊甚至在半個月內將旗下QQ、微信、企微和元寶都作為龍蝦部署渠道,打造了智能體矩陣。
由智能體普及帶來的算力供不應求開啟漲價周期,似乎成為了云廠商新一波紅利的開始。但事實上,這也只是云廠商暫時性的供需錯配。早期大模型產品新品不斷,“訓練”成為云廠商賣的最多的鏟子。而到了AI應用階段,推理成為了主角,云廠商早期因部署大量訓練芯片而在推理環節的冗余面臨巨大挑戰,這才導致小龍蝦們“不夠吃”。
當Token效率問題暴露后,接下來要做的是從大模型底層的進化升級,以及新時代Token經濟的新商業模式。
此前,智譜推出基于GLM-5-Turbo的龍蝦Claw套餐,就包含個人版和Team版。企業可通過龍蝦套餐的Team版,按照實際員工規模靈活訂閱,以可預期的成本實現tokens的充分保障以及AI員工的穩定在線。
隨著智能體應用的真正落地,成熟的AI生態也在形成,未來當上游云廠商看到下游活躍的無數只“龍蝦”,或許已經重新定義了自己的角色。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.