![]()
01
數(shù)據(jù)洪流:
7萬億Token背后的歷史回響
![]()
3月16日至22日,全球最大AI模型API聚合平臺(tái)OpenRouter記錄下一組令人側(cè)目的數(shù)據(jù):全球AI大模型總調(diào)用量20.4萬億Token,其中超過三分之一流向了中國(guó)模型。
連續(xù)三周,中國(guó)AI大模型的周調(diào)用量碾壓美國(guó)同行——7.359萬億對(duì)3.536萬億,漲幅56.9%對(duì)7.35%。排行榜前四席,中國(guó)模型包攬全部:小米MiMo V2 Pro、階躍星辰Step 3.5 Flash、MiniMax M2.5、DeepSeek-V3.2。
但比排名更值得關(guān)注的是這個(gè)被頻繁提及卻鮮被理解的詞——Token(詞元)。
1000年前,北宋工匠畢昇在膠泥上刻下一個(gè)個(gè)反體字,用火焙硬,制成可以反復(fù)排列的"活字",改寫了人類知識(shí)傳播的歷史。今天,工程師們將文本切割成名為"Token"的最小單元,用向量和矩陣重新定義智能生產(chǎn)的邏輯。
從泥活字到數(shù)字Token,從物理排版到神經(jīng)網(wǎng)絡(luò)計(jì)算,一場(chǎng)關(guān)于"最小單元"的革命,似乎正在以驚人的相似性重演。
但相似不等于相同。本文將借用活字印刷的歷史意象,同時(shí)嚴(yán)格劃定類比的邊界——因?yàn)榧夹g(shù)史的精確性,比敘事的流暢性更重要。
02
Token是什么?AI的“文字食材”
——以及它和活字的“表親”關(guān)系
"Token是大語(yǔ)言模型處理文本的基本單元,可理解為'AI眼中的字塊'。"
深圳理工大學(xué)算力微電子學(xué)院助理教授馬智恒這樣解釋。在輸入模型前,文本會(huì)被切分成Token并轉(zhuǎn)換為向量。中文通常每個(gè)字對(duì)應(yīng)1至2個(gè)Token,英文則約0.75個(gè)Token per word。
![]()
想象你向AI提問:"人工智能會(huì)取代人類嗎?"
在人類眼中,這是一句話。在AI眼中,這是若干Token的序列——可能是"人工"+"智能"+"會(huì)"+"取代"+"人類"+"嗎",或者更細(xì)粒度的切分。每個(gè)Token都被編碼成一個(gè)高維向量,在神經(jīng)網(wǎng)絡(luò)的層間通過矩陣運(yùn)算和注意力機(jī)制進(jìn)行處理,最終生成回答。
深圳計(jì)算科學(xué)研究院崖山LAB負(fù)責(zé)人歐偉杰打了個(gè)比方:如果將"算力"視為"電力",那么Token就是消耗的"電量",是衡量AI活躍度與處理規(guī)模的核心指標(biāo)。
綜合開發(fā)研究院通證數(shù)字經(jīng)濟(jì)研究中心執(zhí)行主任馬朝良看得更遠(yuǎn):"Token背后反映的是一個(gè)更大的趨勢(shì)——人類正在把世界'拆解'成可以被機(jī)器理解和處理的最小單位。"
![]()
至此,"Token=數(shù)字活字"的類比似乎成立。但這里必須插入一個(gè)關(guān)鍵的澄清——
活字印刷的"最小單元"(泥活字)是生產(chǎn)工具,可物理復(fù)用;Token的"最小單元"是計(jì)算過程中的臨時(shí)數(shù)據(jù),每次調(diào)用都在消耗算力資源。 換句話說,活字越用越省(邊際成本遞減),Token越用越費(fèi)(邊際成本基本線性增長(zhǎng))。二者在成本邏輯上是反向的。
![]()
那么,真正的類比對(duì)象是什么?
不是Token本身,而是預(yù)訓(xùn)練模型的權(quán)重參數(shù)——那些在海量數(shù)據(jù)中訓(xùn)練得到的、可以被無數(shù)應(yīng)用共享調(diào)用的"知識(shí)結(jié)晶"。這些參數(shù)才是更接近"數(shù)字活字"概念的對(duì)象:刻制一次(訓(xùn)練),復(fù)用無限(推理)。(注:這是本文提出的類比,非學(xué)術(shù)界標(biāo)準(zhǔn)術(shù)語(yǔ))
而Token,更像是印刷過程中的"紙張和油墨"——是消耗品,而非生產(chǎn)工具。
但為何Token的調(diào)用量如此重要?因?yàn)樗饬康氖?數(shù)字活字"被激活的頻率——是技術(shù)民主化的溫度計(jì),而非技術(shù)本身。
03
歷史的回響:活字印刷的啟示與錯(cuò)位
1040年代,北宋慶歷年間,布衣畢昇發(fā)明了膠泥活字印刷術(shù)。
![]()
這比古騰堡的鉛活字印刷機(jī)早了整整400年。沈括在《夢(mèng)溪筆談》中詳細(xì)記錄了這項(xiàng)技術(shù):用膠泥刻字,薄如錢唇,火燒令堅(jiān),然后密布字印,滿鐵范為一板。
但歷史開了一個(gè)殘酷的玩笑。
明清時(shí)期,活字印刷在中國(guó)未能完全取代雕版。原因復(fù)雜:漢字?jǐn)?shù)量龐大,常用字就需數(shù)萬枚字模;泥活字易損,金屬活字成本高昂;科舉制度下的書籍需求結(jié)構(gòu),未能形成足夠的商業(yè)驅(qū)動(dòng)力。直到19世紀(jì)西方鉛活字印刷機(jī)傳入,中國(guó)才真正進(jìn)入活字印刷的大規(guī)模應(yīng)用時(shí)代。
發(fā)明在先,規(guī)模化在后——這是中國(guó)古代技術(shù)史的常見敘事。
![]()
但今天,當(dāng)Token成為智能生產(chǎn)的"消耗單元",中國(guó)似乎正在走出不同的軌跡。這里的關(guān)鍵差異在于:我們并非Token機(jī)制(Transformer架構(gòu)、注意力機(jī)制均源于美國(guó))的"原創(chuàng)發(fā)明者",但正在成為Token規(guī)模化流動(dòng)的主導(dǎo)者。
這是一種不同的歷史角色——不是畢昇式的"技術(shù)首創(chuàng)者",也不是古騰堡式的"技術(shù)整合者",而是"技術(shù)采納者+規(guī)模化應(yīng)用者"的新角色。
04
霸榜背后:中國(guó)Token經(jīng)濟(jì)的三大支點(diǎn)
OpenRouter的數(shù)據(jù)揭示了一個(gè)清晰的格局:中國(guó)模型不僅調(diào)用量大,而且增長(zhǎng)迅猛。這背后是三個(gè)相互強(qiáng)化的支點(diǎn)。
![]()
![]()
第一支點(diǎn):
價(jià)格革命——讓"紙張油墨"便宜到可以揮霍
以DeepSeek、MiniMax M2.5為代表的國(guó)產(chǎn)模型,大幅降低了API使用成本。
"國(guó)產(chǎn)模型以較低的訓(xùn)練成本將AI變?yōu)槿缤衩子望}一樣的生活必需品。"粵港灣控股有限公司執(zhí)行董事羅介平如此評(píng)價(jià)。
這里需要再次厘清類比:如果說模型權(quán)重更接近"數(shù)字活字"(一次性投入,無限復(fù)用),那么推理成本就是"印刷耗材"(每次調(diào)用,持續(xù)消耗)。中國(guó)模型的真正突破,在于讓"耗材"便宜到可以大規(guī)模揮霍——這降低了技術(shù)應(yīng)用的門檻,而非技術(shù)生產(chǎn)的門檻。
活字印刷的核心價(jià)值,是讓知識(shí)復(fù)制的邊際成本斷崖式下跌;今天中國(guó)AI的核心價(jià)值,是讓智能服務(wù)的邊際成本趨近于零。效果相似,機(jī)制不同。
![]()
第二支點(diǎn):
開源生態(tài)——讓"字模"可以被自由復(fù)制
中國(guó)公司在開源模型領(lǐng)域占據(jù)主導(dǎo)地位,與全球頂尖閉源模型的技術(shù)代差已縮短至約三個(gè)月。
開源意味著什么?意味著"數(shù)字活字"(模型權(quán)重)可以被全球開發(fā)者自由獲取、改進(jìn)、再分發(fā)。畢昇的活字技術(shù)受限于時(shí)代,未能形成持續(xù)迭代的社區(qū);今天的開源模型生態(tài),正在以互聯(lián)網(wǎng)的速度自我強(qiáng)化。
![]()
第三支點(diǎn):
場(chǎng)景紅利——讓"印刷機(jī)"遍布每個(gè)角落
這是最具中國(guó)特色的變量。
![]()
微信月活13億,釘釘7億,飛書2億。這些超級(jí)應(yīng)用構(gòu)成了AI觸達(dá)用戶的"自來水管網(wǎng)"。
"我國(guó)開發(fā)者貢獻(xiàn)了大量的Token消耗,"羅介平指出,"這些用戶只需輕輕一點(diǎn)即可調(diào)用AI能力,這無疑帶來了海量的模型調(diào)用需求。"
歐偉杰稱之為"長(zhǎng)尾效應(yīng)":隨著國(guó)內(nèi)大模型在推理成本、響應(yīng)速度、API成本等方面的持續(xù)優(yōu)化,大量中小企業(yè)和開發(fā)者開始將AI接入業(yè)務(wù)流程,觸發(fā)了調(diào)用量的指數(shù)級(jí)增長(zhǎng)。
十億級(jí)用戶入口 + 極低調(diào)用成本 + 開源技術(shù)生態(tài),這三者的乘積效應(yīng),構(gòu)成了中國(guó)Token經(jīng)濟(jì)的基本盤。
但請(qǐng)注意:這里的競(jìng)爭(zhēng)優(yōu)勢(shì)不在于Token本身,而在于Token的流動(dòng)效率——是基礎(chǔ)設(shè)施、成本控制、場(chǎng)景滲透的綜合結(jié)果。
05
冷思考:Token洪流中的真問題
繁榮的表象下,需要保持清醒。
首先是"量"與"質(zhì)"的落差。
馬智恒提醒:"我們也必須清醒認(rèn)識(shí)到,美國(guó)在原始模型創(chuàng)新、高端芯片與算力基礎(chǔ)設(shè)施等領(lǐng)域,仍保持著顯著優(yōu)勢(shì)。"
調(diào)用量領(lǐng)先不等于技術(shù)領(lǐng)先。中國(guó)模型在應(yīng)用層的Token消耗上占據(jù)優(yōu)勢(shì),但在基礎(chǔ)層的模型架構(gòu)創(chuàng)新、硬件層的算力自主性上,短板依然存在。
其次是"消耗"與"沉淀"的錯(cuò)位。
歐偉杰指出了更隱蔽的挑戰(zhàn):"海量Token的背后,是更大規(guī)模的數(shù)據(jù)吞吐與更復(fù)雜的數(shù)據(jù)治理挑戰(zhàn)。大模型的每一次調(diào)用,都依賴底層數(shù)據(jù)庫(kù)系統(tǒng)對(duì)實(shí)時(shí)數(shù)據(jù)、歷史知識(shí)、用戶交互的精準(zhǔn)管理與毫秒級(jí)響應(yīng)。"
這里有一個(gè)反諷:Token調(diào)用量越大,意味著"數(shù)字活字"(模型權(quán)重)被使用得越頻繁,但同時(shí)也意味著系統(tǒng)脆弱性越高——數(shù)據(jù)治理、實(shí)時(shí)響應(yīng)、安全合規(guī)的壓力呈指數(shù)級(jí)增長(zhǎng)。
活字印刷不僅要有字塊,還要有精良的排版工藝、優(yōu)質(zhì)的紙張墨水、高效的發(fā)行網(wǎng)絡(luò)。Token經(jīng)濟(jì)同樣需要完整的"排版生態(tài)"。
![]()
最后是"薄利"與"溢價(jià)"的困境。
中國(guó)模型以價(jià)格優(yōu)勢(shì)收獲全球開發(fā)者青睞,但這是否意味著我們只能做"薄利多銷"的生意?如何在Token調(diào)用量的基礎(chǔ)上,構(gòu)建更高附加值的服務(wù)和品牌?
這是從"制造大國(guó)"到"品牌強(qiáng)國(guó)"的老命題,在AI時(shí)代的新投射。
06
未來誰(shuí)將成為"智能排版大師"?
![]()
3月,阿里巴巴正式成立Alibaba Token Hub事業(yè)群,旨在圍繞"創(chuàng)造Token、輸送Token、應(yīng)用Token"構(gòu)建完整的AI生態(tài)體系。
幾乎同時(shí),英偉達(dá)CEO黃仁勛在GTC 2026上提出"Token經(jīng)濟(jì)學(xué)",將數(shù)據(jù)中心定義為生產(chǎn)AI智能Token的工廠,強(qiáng)調(diào)"算力即收入"。
兩種視角,兩種邏輯。
美國(guó)視角:數(shù)據(jù)中心是Token工廠,算力即收入,核心是生產(chǎn)能力的壟斷。
中國(guó)實(shí)踐:Token Hub是生態(tài)樞紐,創(chuàng)造-輸送-應(yīng)用全鏈條打通,核心是網(wǎng)絡(luò)效應(yīng)的捕獲。
哪種路徑更具可持續(xù)性?歷史或許能提供參照。
古騰堡的真正突破,不在于發(fā)明了活字(金屬活字早已存在),而在于整合了活字鑄造、印刷機(jī)、油墨配方、紙張供應(yīng)、商業(yè)出版的全鏈條。技術(shù)的發(fā)明重要,但技術(shù)的"排版"——即如何將其嵌入社會(huì)經(jīng)濟(jì)系統(tǒng)的復(fù)雜網(wǎng)絡(luò)——可能更重要。
今天,中國(guó)擁有最豐富的應(yīng)用場(chǎng)景、最龐大的用戶基數(shù)、最活躍的開發(fā)生態(tài)。這些條件使得中國(guó)有機(jī)會(huì)成為AI時(shí)代的"排版大師"——不僅生產(chǎn)Token,更定義Token流動(dòng)的方式、規(guī)則和價(jià)值分配機(jī)制。
尾聲:
劃定邊界后的回望
回到1000年前的開封府,畢昇在膠泥上刻下最后一個(gè)反體字,火光照亮了他布滿老繭的雙手。
![]()
他不知道,這項(xiàng)技術(shù)將在400年后才在異國(guó)他鄉(xiāng)真正綻放。他更不知道,1000年后,另一群工程師正在服務(wù)器機(jī)房中,以每秒萬億次的速度切割、編碼、重組著名為"Token"的數(shù)字單元。
從泥活字到數(shù)字Token,從物理排版到神經(jīng)網(wǎng)絡(luò),人類對(duì)技術(shù)民主化的追求從未停止。但本文必須以一個(gè)嚴(yán)格的限定作結(jié):
Token不是數(shù)字活字。模型權(quán)重才是。Token只是這些"數(shù)字活字"被激活時(shí)產(chǎn)生的漣漪。
中國(guó)AI的7萬億Token周調(diào)用量,衡量的不是技術(shù)原創(chuàng)性,而是技術(shù)擴(kuò)散的速度和廣度。這不是畢昇式的"發(fā)明者敘事",也不是古騰堡式的"整合者敘事",而是一種新的"規(guī)模化敘事"——同樣偉大,但性質(zhì)不同。
這一次,歷史沒有完全重演。中國(guó)正在書寫新的劇本。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.