AI圈迎來重磅官宣:困擾業內已久的Token中文名,終于有了官方定論——詞元!
近日,國家數據局在官方公告中首次啟用“詞元”作為Token的標準譯名。這標志著,這一AI核心術語在中文人工智能領域正式“定調”,從此告別翻譯混亂的局面。
更讓人震撼的是,在國新辦3月24日的新聞發布會上,國家數據局局長劉烈宏披露了一組亮眼的數據:截至今年3月,我國日均詞元調用量已突破140萬億!
![]()
(圖片來源:新浪微博)
這個數字有多驚人?對比一下就懂了:相比2024年初的1000億,增長了1000多倍;就連對比2025年底的100萬億,短短三個月也實現了40%以上的增長。中國AI的發展速度,肉眼可見的迅猛。
劉烈宏表示,詞元調用量的爆發式增長,正是中國人工智能進入快速增長階段的最好證明。如今AI的應用場景不斷深化,早已從簡單的對話升級到了能決策、能執行的智能體。而備受關注的詞元出海,更是我國AI產業競爭力增強的直接體現。
可能有人會問,到底什么是詞元?這個理解起來一點都不復雜,《人民日報》早在今年1月就發布科普文章,將詞元定義為“處理文本的最小數據單元”。
簡單來說,就是AI大模型處理數據時,拆分出的“最小信息載體”,可以是一個字、一個詞片段,甚至一個符號。
舉個通俗的例子:“我愛中國!”這句話,在AI眼里就會被拆分成“我”、“愛”、“中國”、“!”四個詞元,是不是一下子就懂了?
值得一提的是,目前蘋果中國官網、央視新聞、中國計算機學會等,都已統一使用“詞元”這一表述,足以見得它的權威性。
其實不難發現,互聯網時代的核心度量是流量,而到了人工智能時代,詞元正在成為新的關鍵指標。我們給AI輸入的每一個字,AI生成的每一段話、識別的每一幅圖像,本質上都在消耗詞元。
從術語統一到調用量爆發,這背后是中國AI產業的穩步崛起,也是智能時代加速到來的信號。未來,隨著詞元相關體系的不斷完善,中國AI還會帶來哪些驚喜?值得我們共同期待!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.