![]()
![]()
Token是AI云的重要組成部分,但將其等同于AI云本身,或作為唯一衡量標準,仍為時過早且不夠科學(xué)。它無法全面呈現(xiàn)中國數(shù)字化市場的復(fù)雜性和多樣性
文|吳俊宇
編輯 | 謝麗容
隨著云計算從以CPU(中央處理器)為核心的通用計算,逐步走向以GPU(圖形處理器)為代表的智能計算,AI云正在成為中國乃至全球云市場的共識。
在這一過程中,MaaS(模型即服務(wù))平臺正在成為繞不開的一環(huán)。因為,通過MaaS調(diào)用模型、消耗 Token(詞元),已經(jīng)是企業(yè)使用AI云的一種重要形式。
過去一年,圍繞Token的調(diào)用量、增速、規(guī)模乃至排名,討論明顯升溫(詳見《》)。近一年,國內(nèi)外云廠商(包括亞馬遜AWS、微軟Azure、谷歌云GCP,阿里云、百度智能云、火山引擎)都在不同時間、不同程度地披露了自己的Token消耗相關(guān)情況。
Token甚至像流量一樣,成為重要統(tǒng)計指標。國家數(shù)據(jù)局2025年8月數(shù)據(jù)顯示,2024年初中國日均Token消耗量1000億。截至2025年6月底,中國日均Token消耗量突破30萬億。一年半時間增長了300多倍,這反映了中國AI應(yīng)用規(guī)模的快速增長。
換句話說,當下的AI云市場,Token正成為部分從業(yè)者眼中的“北極星指標”。所謂“北極星指標”,可理解為“核心指標”,指企業(yè)內(nèi)能代表最終成功,指引所有團隊努力方向的指標。它像北極星一樣,為整個組織提供清晰、統(tǒng)一的戰(zhàn)略指引。
之所以會出現(xiàn)這種狀態(tài),一個重要原因是,Token是當前最直觀、最容易量化,也最容易比較的指標之一。它有極高的敘事效率——既方便市場傳播,也容易被資本和客戶理解。
這個觀點得到了多位行業(yè)人士的認同。一位中國云廠商架構(gòu)師對我們表示,商業(yè)世界往往更偏好簡單、清晰的單一指標。2025年6月,一位國際市場調(diào)研機構(gòu)分析師在一場小規(guī)模討論提到,AI云市場發(fā)展初期,Token調(diào)用量相對容易衡量。但他同時認為,長期來看營收規(guī)模才是更重要的指標。
當一個指標被當作“北極星”,它是否也可能遮蔽其他重要事實?答案是肯定的。
其一,無論是在中國還是美國,當前各大云廠商的Token收入,在整體云收入中的占比仍然較低。至少在目前,Token市場的規(guī)模,尚不足以單獨支撐起云市場的整體增長。
其二,現(xiàn)有的Token統(tǒng)計存在盲區(qū)。市場調(diào)研機構(gòu)披露的Token消耗量,大多基于公共云MaaS平臺的API(應(yīng)用程序接口)調(diào)用數(shù)據(jù)。但由于技術(shù)和部署方式的限制,它很難全面覆蓋所有應(yīng)用場景。這意味著,發(fā)生在GPU云租賃、私有化部署,以及制造、汽車、機器人等設(shè)備端的AI算力使用,往往并未被完整計入。這可能會低估AI的真實使用規(guī)模。
其三,在企業(yè)真實IT采購邏輯中,Token更多是使用之后的結(jié)果,而非核心采購決策依據(jù)。企業(yè)決策往往圍繞AI是否能夠進入業(yè)務(wù)流程、能否降低成本等問題展開。Token消耗量,通常不會在采購階段被單獨列為核心指標。
簡單理解,Token是AI云的重要組成部分,但將其等同于AI云本身,或作為唯一衡量標準,仍為時過早且不夠科學(xué)。它無法全面呈現(xiàn)中國數(shù)字化市場的復(fù)雜性和多樣性。
![]()
Token市場規(guī)模到底有多大?
通過MaaS平臺使用Token,這代表了相當一部分前沿開發(fā)者、AI創(chuàng)新企業(yè)的前沿需求。無論是中國、美國云廠商,都對這部分市場保持著戰(zhàn)略關(guān)注。
包括亞馬遜AWS、阿里云等在內(nèi)的全球云廠商,都在積極探索如何擴大MaaS業(yè)務(wù)規(guī)模。
亞馬遜AWS管理層2025年10月財報電話會議披露,長遠來看,Bedrock(亞馬遜AWS的MaaS平臺)收入貢獻將與EC2(亞馬遜AWS的CPU和GPU計算實例業(yè)務(wù),總營收占比超過30%)不相上下。但亞馬遜AWS管理層未披露,Bedrock收入的詳細統(tǒng)計口徑,以及上述目標的具體實現(xiàn)時間。
我們了解到,阿里云在2025年11月末啟動了“百煉戰(zhàn)役”,目標是短期內(nèi)將百煉(阿里云的MaaS平臺)Token調(diào)用規(guī)模提升三倍以上。阿里云還為之成立了專門的銷售組織。在字節(jié)跳動旗下的火山引擎,Token收入已是銷售團隊KPI考核核心指標之一。
2025年12月末,阿里云智能集團資深副總裁、公共云事業(yè)部總裁劉偉光在一場小規(guī)模溝通中對我們表示,他認同亞馬遜AWS對MaaS收入長期增長的判斷。他的看法是,當模型能力持續(xù)增強、Agent(智能體)逐步成熟,并覆蓋大量IT能力有限的長尾企業(yè)后,MaaS收入在云廠商整體收入的占比,有可能達到30%甚至更高。但他同時強調(diào),目前行業(yè)仍處于早期階段,過早給出明確的市場規(guī)模或占比,并不具備現(xiàn)實意義。
多份市場調(diào)研數(shù)據(jù)表明,目前Token市場增速很快,但在AI云市場規(guī)模仍然有限。短期內(nèi),它尚不足以單獨支撐起中國云市場大盤的整體增長。
國際市場調(diào)研機構(gòu)Omdia 2025年9月數(shù)據(jù)顯示,2024年中國AI云市場規(guī)模約29億美元,其中AI IaaS(基礎(chǔ)設(shè)施)23億美元,占比79%;AI PaaS(平臺軟件)5.6億美元,占比24%;AI MaaS收入規(guī)模0.3億美元,占比1%。
Omdia預(yù)測,2025年中國AI云市場規(guī)模將增長至72億美元,2030年將增長至268億美元。2030年AI MaaS市場規(guī)模將達到25億美元。按照這一預(yù)測,AI MaaS 2030年在AI云市場占比約為9%。
![]()
我們了解到的情況是,2024年中國主要云廠商Token收入總和不超過10億元。2025年各個云廠商Token收入增長均大幅增長。目前Token收入高的云廠商超過10億元,但Token收入低的云廠商約為數(shù)億元。在一些規(guī)模相對較小的云廠商收入結(jié)構(gòu)中,Token收入可能達到10%左右。但在頭部云廠商收入結(jié)構(gòu)中,Token收入占比僅為1%左右。
圍繞Token收入未來的增長空間,行業(yè)內(nèi)部也存在不同測算。Omdia預(yù)測相對保守,市場上也存在一些更樂觀的預(yù)測口徑。
中國某ICT硬件企業(yè)的一位資深戰(zhàn)略規(guī)劃人士2025年7月曾對一些中國云廠商未來可能的Token收入進行了敏感性測試(一種根據(jù)商業(yè)模型,綜合外部市場條件變化進行市場動態(tài)分析的方法)。
他對我們表示,如果Token價格依舊維持當前水平,他測試的結(jié)果顯示,某中國云廠商Token調(diào)用收入未來1年-2年可能增長至40億-70億元。但他同時強調(diào),這一測算高度依賴模型能力、應(yīng)用滲透率及Token定價的變化,并不等同于行業(yè)整體判斷。
按照這種增長預(yù)判,Token收入在部分云廠商的營收大盤占比會更大,可能會成為部分新興云廠商的主要營收增長來源。但它在短期內(nèi)(未來1年-3年)仍無法構(gòu)成中國AI云市場大盤的核心增長來源。
某國內(nèi)頭部云廠商的一位高管和國內(nèi)某大模型平臺業(yè)務(wù)負責(zé)人在2025年12月在兩場不同的對話中,分別對我們表達了同一個觀點:AI云市場仍處于早期發(fā)展,如果過于強調(diào)Token市場的規(guī)模乃至排名,容易用短期指標替代對長期增長結(jié)構(gòu)的判斷。
上述中國大模型平臺業(yè)務(wù)負責(zé)人提到,他所在的云廠商并未參與Token相關(guān)爭論。在他看來,中國云廠商關(guān)于Token敘事的差異,并非AI云技術(shù)路線的根本分歧,而是客戶結(jié)構(gòu)與歷史業(yè)務(wù)基礎(chǔ)不同而導(dǎo)致的差異。
他進一步解釋,阿里云強調(diào)多形態(tài)并存(GPU云租賃+MaaS調(diào)用+私有化部署)并非保守,這是因為它誕生16年形成了龐大多樣的客戶結(jié)構(gòu)(互聯(lián)網(wǎng)、金融、制造、公共部門、中小企業(yè)、AI創(chuàng)業(yè)企業(yè)和前沿開發(fā)者等),它需要尊重所有客戶需求。火山引擎更強調(diào)Token是因為,豆包App等公司內(nèi)部業(yè)務(wù)Token消耗占比高,云業(yè)務(wù)的核心客戶以前沿開發(fā)者、AI創(chuàng)業(yè)公司為主。Token消耗增長快,這是“后來者”容易講清增長敘事的一條路。
![]()
Token統(tǒng)計中存在哪些盲區(qū)?
AI云仍在發(fā)展早期。一個高度復(fù)雜、仍在快速演進的技術(shù)體系中,單一指標一旦被賦予過多意義,往往也容易遮蔽一些更難被量化卻更關(guān)鍵的事實。
目前,使用AI算力的形式非常多樣——通過公共云租賃GPU部署模型、采購GPU服務(wù)器進行模型私有化部署后進行后訓(xùn)練或強化學(xué)習(xí)、MaaS平臺調(diào)用Token、端側(cè)算力部署模型等都是主流方案。
![]()
不同類型的企業(yè)通常傾向于采用不同的方案。比如,大型互聯(lián)網(wǎng)公司通常習(xí)慣租用GPU云服務(wù)。政企行業(yè)(如金融、能源、制造等行業(yè))和公共部門主要是采購GPU硬件進行私有化部署,AI創(chuàng)業(yè)公司和前沿開發(fā)者則是傾向于選擇MaaS平臺調(diào)用Token。在汽車、機器人、行業(yè)設(shè)備場景中,往往又是通過本地或邊緣環(huán)境使用算力。
此外,每一家企業(yè)的AI算力使用形態(tài),都不是單一的。據(jù)我們了解,阿里云70%的企業(yè)客戶,租用GPU云服務(wù)的同時,也通過MaaS平臺調(diào)用Token。深度使用AI的企業(yè),通常是多形態(tài)并存。
某零售企業(yè)的數(shù)字化策略負責(zé)人對我們表示,他們在AI應(yīng)用PMF(產(chǎn)品市場匹配)驗證階段,優(yōu)先通過MaaS平臺調(diào)用模型進行可行性測試,因為Token計費方式更靈活、試錯成本更低。當AI應(yīng)用進入大規(guī)模部署階段后,傾向于租用GPU實例,因為長期成本結(jié)構(gòu)更可控。
此外,某國內(nèi)云廠商的一位資深架構(gòu)師也對我們表示,他走訪客戶發(fā)現(xiàn),一些制造企業(yè)既采購GPU硬件進行私有化部署,也使用MaaS平臺。其中,數(shù)據(jù)敏感型的業(yè)務(wù)使用本地算力,非敏感業(yè)務(wù)通過MaaS平臺使用Token。他認為,Token計費靈活,這客觀上加速了制造企業(yè)的上云進程。
我們通過綜合調(diào)研了解到,某社交媒體、某支付平臺每年云支出(含計算、存儲、網(wǎng)絡(luò)、數(shù)據(jù)庫、MaaS等公共云產(chǎn)品)高達數(shù)十億乃至百億元。這類頭部互聯(lián)網(wǎng)企業(yè),2025年直接通過MaaS平臺使用Token的費用,在整體云支出中的占比為極低的個位數(shù)。
一位頭部社交媒體相關(guān)人士2025年11月曾對我們表示,他所在企業(yè)的云支出仍以計算、存儲、網(wǎng)絡(luò)、數(shù)據(jù)庫為主。AI算力相關(guān)投入以GPU云租賃、自建推理與訓(xùn)練集群等方式為主,MaaS產(chǎn)生的Token消耗少之又少。
另一個重要事實是,中國市場可被統(tǒng)計到的Token消耗,主要集中在娛樂、對話等To C(面向消費者)的移動互聯(lián)網(wǎng)場景。這類應(yīng)用更容易通過MaaS調(diào)用模型,更容易在早期形成可觀的Token規(guī)模。但更廣闊的To B(面向企業(yè)級)領(lǐng)域,目前仍在AI應(yīng)用早期,未來增長潛力更大。
綜上所述,真實Token使用場景,遠比統(tǒng)計口徑更復(fù)雜、多樣。由于技術(shù)所限,不同機構(gòu)很難全面掌握所有場景的Token使用情況。如果只看單一的統(tǒng)計數(shù)據(jù),很容易得出彼此矛盾的結(jié)論。
國際市場調(diào)研機構(gòu)IDC 2025年數(shù)據(jù)顯示,截至2025上半年,阿里云在中國大模型公有云服務(wù)(即Token市場)占比為27.0%,位居第二。阿里云在這里似乎是被低估的。
OpenRouter是全球大模型API聚合平臺,集成了全球主流模型,它反映了全球前沿開發(fā)者和AI創(chuàng)新企業(yè)的使用習(xí)慣。OpenRouter數(shù)據(jù)顯示,2025年阿里Qwen系列模型全球Token消耗量長期位居全球第六,占比約為4%-7%。這在國內(nèi)位居前列,超過IDC統(tǒng)計中的其他廠商。阿里云在這里似乎排名又更高。
這種“矛盾”的成因是,阿里的通義千問、通義萬相等都是開源模型。IDC無法統(tǒng)計到開源模型被使用的情況。OpenRouter主要覆蓋通過聚合平臺發(fā)生的調(diào)用Token,又難以統(tǒng)計云廠商自有MaaS平臺內(nèi)部、企業(yè)私有化部署、端側(cè)推理以及真實總量。
![]()
因此,無論采用哪種單一統(tǒng)計口徑,都無法反映市場真實全貌。這些方式,都會低估中國AI落地的真實情況。
國際市場調(diào)研機構(gòu)Gartner在《2026年十大戰(zhàn)略技術(shù)趨勢》給了一個更全面的解釋——2028年60%以上的企業(yè)級AI模型將采用特定領(lǐng)域模型(DSLM)(根據(jù)特定數(shù)據(jù)集訓(xùn)練的AI模型,準確性、合規(guī)性更高),它們可能同時通過云、本地、設(shè)備、MaaS部署。
某中國云廠一位資深人士對我們總結(jié)稱,前沿開發(fā)者、AI創(chuàng)新企業(yè)、企業(yè)PMF驗證階段習(xí)慣通過MaaS平臺調(diào)用API使用Token,這部分數(shù)據(jù)最容易統(tǒng)計。公共云租賃GPU部署更適合互聯(lián)網(wǎng)或其他大型公司大規(guī)模部署階段的需求。通過私有化或本地部署(On-premise)算力,則符合金融、政府等數(shù)據(jù)合規(guī)要求的機構(gòu)。端側(cè)算力,適合于汽車、機器人等低延時場景需求。后三種Token消耗都難以被統(tǒng)計。
在他看來,嚴格定義廣義Token消耗量,要把MaaS平臺、公共云GPU推理集群產(chǎn)生Token、私有化模型部署產(chǎn)生Token,設(shè)備端模型產(chǎn)生的Token全部統(tǒng)計在內(nèi)。
![]()
![]()
Token是企業(yè)IT采購重點嗎?
在討論Token的規(guī)模、增速與統(tǒng)計口徑之前,一個更基礎(chǔ)、卻常被忽略的問題是:大型企業(yè)在采購AI云服務(wù)時,究竟是如何做決策的?
在多數(shù)企業(yè)的真實IT采購邏輯中,Token更多是AI應(yīng)用投入運行后的成本指標,而非采購決策階段被單獨衡量的核心依據(jù)。因為,從企業(yè)CIO(首席信息官)、CTO(首席技術(shù)官)的視角來看,Token消耗量并不能直接和業(yè)務(wù)價值掛鉤,更多是和成本掛鉤。
Token本質(zhì)上是模型調(diào)用的技術(shù)計量單位,它類似CPU使用率、GPU小時數(shù)。因此,無論是在互聯(lián)網(wǎng)企業(yè)、制造業(yè),還是金融、能源與公共部門,它們在引入AI能力時,真正衡量的首要業(yè)務(wù)價值是——能否提高收入,能否降低成本,能否縮短流程周期。
多位企業(yè)IT負責(zé)人曾對我們表示,CIO、CTO考量中的真實AI落地流程大致分成兩階段。
第一階段是,Agent能否擺脫獨立外掛,進入業(yè)務(wù)流程并與之深度融合。經(jīng)過概念驗證階段的小規(guī)模試用后,Agent如何真正長期、穩(wěn)定地參與業(yè)務(wù)運行。這要求模型能力,系統(tǒng)穩(wěn)定性、延遲、可靠性,以及與既有IT架構(gòu)的兼容性,都達到可控水平。在這一階段,企業(yè)更關(guān)心“能不能用”“敢不敢用”,而不是“用了多少Token”。
在第二階段,成本與效率逐漸浮出水面。只有當Agent已經(jīng)被部署進具體業(yè)務(wù)場景,開始持續(xù)運行之后,他們會開始考量成本問題。其中包括云成本,還包括人力、外包、系統(tǒng)維護以及流程摩擦所帶來的隱性成本。在企業(yè)的成本核算與優(yōu)化體系中,模型調(diào)用頻次、Token消耗量以及由此帶來的算力成本是云賬單的一部分。在這樣的決策邏輯下,Token的角色更接近于運營指標,而非采購指標。
一位中國大型企業(yè)集團數(shù)字化部門技術(shù)人士對我們表示,他們最關(guān)注的,不是模型調(diào)用消耗了多少Token,而是Token帶來了多少算力成本。因為AI應(yīng)用的Token成本難以預(yù)測,不像過去是買斷制、訂閱制軟件相對固定。
簡而言之,Token消耗量更偏供給方(云廠商)視角,而非需求方(進行數(shù)字化轉(zhuǎn)型的企業(yè))視角。因為,企業(yè)感知AI價值的方式,更多體現(xiàn)在Agent等AI應(yīng)用上——Agent才是承載業(yè)務(wù)邏輯,吞吐Token,直接參與業(yè)務(wù)流程的基本單元。
部分大型企業(yè)智能化轉(zhuǎn)型中,甚至在用Agent定義“北極星指標”,如一崗一助手、一人一分身。它更關(guān)注Agent滲透率,AI業(yè)務(wù)滲透率等更加全面的指標。
Token很重要,但更重要的是,如何讓Token在真實業(yè)務(wù)場景中,通過Agent轉(zhuǎn)化為可衡量、可持續(xù)的業(yè)務(wù)價值。否則,這甚至可能會導(dǎo)致“負向激勵”。
一位中國云廠商資深人士提到,如果過分以Token收入增長作為目標,可能會導(dǎo)致在實際工程中,更強、更成熟的模型往往能夠以更少的Token完成同樣的任務(wù),而模型能力不足、系統(tǒng)尚未優(yōu)化時,Token消耗反而可能更高。
上述中國云廠商大模型業(yè)務(wù)負責(zé)人2025年12月曾對我們表達了這樣一個觀點——中國數(shù)字化市場的需求、層次是復(fù)雜多樣的。云廠商要從客戶視角出發(fā),而不是自己想賣什么,進而期望客戶用什么。
Token對前沿開發(fā)者、AI創(chuàng)新企業(yè)的需求很重要,但他同時認為,中國數(shù)字化市場的真實結(jié)構(gòu)是,頭部互聯(lián)網(wǎng)企業(yè),金融、能源、交通等行業(yè)的央國企,制造、零售等領(lǐng)域的大型民營企業(yè)仍是中國IT支出的主力軍。這是中國數(shù)字化轉(zhuǎn)型的深水區(qū)。因此,應(yīng)該尊重這部分客戶的現(xiàn)實選擇。
企業(yè)使用AI,最終目的還是用AI逐步替代、吞并、重構(gòu)幾項企業(yè)成本——人力成本、傳統(tǒng)軟件成本、部分外包與流程成本、舊IT架構(gòu)中的低效環(huán)節(jié)。真正決定AI云長期增長空間的,是AI是否能夠穩(wěn)定進入更多業(yè)務(wù)流程,持續(xù)優(yōu)化業(yè)務(wù)運營,改變企業(yè)IT結(jié)構(gòu)。
在2025年12月末的這場溝通中,劉偉光的看法是,云計算到今天并沒有改變本質(zhì),那就是為應(yīng)用服務(wù)。只是承載的類型從傳統(tǒng)應(yīng)用擴展到了大模型或AI應(yīng)用。重要的是,云計算技術(shù)棧要與時俱進。AI云不是簡單的AI+云,而是云計算IaaS、PaaS、MaaS平臺、Agent平臺全棧深度融合。這樣才能讓企業(yè)客戶高效部署AI應(yīng)用。
“這十多年,中國云市場是全球競爭最激烈的,各種概念層出不窮,價格戰(zhàn)也屢見不鮮。但如果用更長的周期去看未來,技術(shù)能力和技術(shù)布局的前瞻性永遠是市場的勝負手,這終將被時間驗證。”劉偉光說。
如果把目光放到中國企業(yè)未來5年-10年的數(shù)字化轉(zhuǎn)型,AI云的競爭重點是系統(tǒng)工程能力——讓更多企業(yè)客戶能夠門檻更低、更好地使用AI,才是關(guān)鍵所在。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.