![]()
2012 年,張一鳴給新公司取名,用了一個(gè)計(jì)算機(jī)術(shù)語做名字——字節(jié)。
這大概是中國科技公司里最讓人服氣的一個(gè)名字。兩個(gè)字,有技術(shù)感,有力量感,認(rèn)知成本幾乎為零。你不需要懂計(jì)算機(jī),只需要認(rèn)中文,就知道「字節(jié)」說的是某種文字層面的基本單位。
![]()
干凈、準(zhǔn)確、過目不忘。能拿一個(gè)術(shù)語做公司名且毫無違和感,這本身就說明這個(gè)詞翻譯得有多好。
現(xiàn)在,「字節(jié)跳動(dòng)」成了全球價(jià)值最高的獨(dú)角獸公司。但要是問你:如果當(dāng)年那家公司叫「存儲(chǔ)單位跳動(dòng)」,你還覺得那么自然嗎?
別笑,這就是最近 AI 行業(yè)在發(fā)生的事。
別吵了,Token 最好的中文翻譯一直在那兒
上周大家對于 Token 該翻譯成生什么吵翻天「模元」「智元」「靈符」「令牌」「偷啃」……社交媒體隔段時(shí)間就會(huì)掀起一輪爭論,每次都以各說各話收場。
這些候選詞各有各的巧思,但放在一起看,你會(huì)發(fā)現(xiàn):大家都在比誰更有靈氣、更有意境,卻沒人先問一個(gè)最根本的問題——Token在技術(shù)上到底是什么?
它不是「智能」的單位,不是「模型」的單位,它是語言處理的最小單位。
其實(shí)在這場混戰(zhàn)之前,答案早就在那里了。
「靈符」有東方賽博美感,但術(shù)語不需要意境,它需要精確。「智元」大氣,但 Token是語言的處理單位,不是「智能」的單位,往上貼「智」字是貼錯(cuò)了標(biāo)簽。「令牌」最離譜,這是 Token在計(jì)算機(jī)安全領(lǐng)域的既有譯法,特指身份驗(yàn)證憑證,拿來混用等于把銀行卡和撲克牌叫同一個(gè)名字。「偷啃」這種音譯就完全喪失了中文的優(yōu)勢了
在自然語言處理(NLP)學(xué)術(shù)文獻(xiàn)里,Token 作為文本的最小處理單位,長期被譯為「詞元」。
詞,指向語言屬性;元,指向最小粒度。兩個(gè)字,一個(gè)管歸屬,一個(gè)管層級(jí)。
蘋果用了這個(gè)譯法。打開 Apple 中國官網(wǎng),Apple Intelligence 的技術(shù)頁寫著「詞元響應(yīng)速度」。
![]()
要知道蘋果的中文本地化團(tuán)隊(duì)是出了名的較真——AirDrop 叫「隔空投送」,Live Text 叫「實(shí)況文本」,每個(gè)詞都是反復(fù)推敲的結(jié)果,目標(biāo)只有一個(gè):準(zhǔn)確、簡潔、有造詞美感。
蘋果選了「詞元」,絕不是心血來潮。無獨(dú)有偶,在央視新聞節(jié)目里,Token 同樣被譯作詞元。
當(dāng)蘋果和央視不約而同選了同一個(gè)中文翻譯,其實(shí)已經(jīng)形成了事實(shí)標(biāo)準(zhǔn)的雛形,只是差更多人開口。
翻譯界有句老話:好的翻譯不是發(fā)明,是發(fā)現(xiàn)——發(fā)現(xiàn)那個(gè)本該如此的中文表達(dá)。
APPSO 認(rèn)為,詞元是唯一一個(gè)同時(shí)滿足信、達(dá)、雅三個(gè)標(biāo)準(zhǔn)的翻譯。 它準(zhǔn)確(信),一看就懂(達(dá)),有術(shù)語的凝練和古典感(雅)。
這場爭論,其實(shí)沒什么可吵的。
「提示詞」, AI 時(shí)代最將就的翻譯
Token 的問題可以收場了。Prompt 的問題,才剛剛開始。
目前業(yè)內(nèi)通用叫法是「提示詞」。三個(gè)字,好懂,傳播也廣——但說實(shí)話,這個(gè)詞不夠用,早就不夠用了,只是沒人較真去捅破這層窗戶紙。
![]()
「提示詞」的問題不在于它翻譯錯(cuò)了,而在于它把「提示」把權(quán)力關(guān)系翻反了。
你寫一段 system prompt,定義模型的人格邊界,規(guī)定它只能做什么、不能做什么,指定輸出格式和語氣——這叫「提示」?這是在下令。
「提示」暗含的邏輯是:模型是主角,人在旁邊小聲提醒它一下。但真實(shí)的權(quán)力結(jié)構(gòu)恰恰相反,是人在驅(qū)動(dòng)模型。一個(gè)譯名把主語關(guān)系弄反了,這就不只是措辭問題,是認(rèn)知框架問題。
「詞」字還把格局說小了。 現(xiàn)在的 prompt 早就不是一兩句話的事。Anthropic 內(nèi)部的 system prompt 有幾千字。企業(yè)級(jí) RAG 應(yīng)用里,一條 prompt 可能塞進(jìn)了整本產(chǎn)品手冊。用「詞」來描述這個(gè)東西,就像用「便簽」來形容一份合同——你也沒說錯(cuò),但你說小了。
而且你看像素、字節(jié)、詞元,清一色兩個(gè)字。兩字詞在中文里天然帶有凝練感,是能進(jìn)教科書、進(jìn)國標(biāo)文檔的形態(tài)。「提示詞」三個(gè)字,更像是技術(shù)社區(qū)里約定俗成的口語簡稱,不像一個(gè)嚴(yán)肅的技術(shù)命名。
好比當(dāng)年把 byte 翻成「存儲(chǔ)小段」、把 pixel 翻成「圖像色點(diǎn)」,不是不能用,是將就。
「提示詞」就是 AI 時(shí)代最將就的翻譯之一。
「文令」 Prompt
APPSO 的提議是:Prompt,應(yīng)該翻譯為「文令」。
說理由之前,先說這個(gè)詞怎么推敲出來的,過程本身就是最好的論據(jù)。
最初我們想到的是「句令」。句,成句的文字;令,命令、指令。古典美感十足,讀起來也響亮有力。
但仔細(xì)想有個(gè)漏洞:「句」暗示 prompt 是「一句話」。現(xiàn)實(shí)中,prompt 可以是一個(gè)詞,可以是三段話,可以是五千字的系統(tǒng)指令——「句」給了它一個(gè)不存在的邊界限制。
如果換成「文」,這個(gè)問題就消失了。
一字,是文字。一句,是文句。一段,是文段。一篇,是文章。不管 prompt 長成什么樣,「文」都接得住,沒有邊界焦慮。
![]()
于是定了, Prompt 就是文令。
文——文字、文本、文章。Prompt 的載體永遠(yuǎn)是文字,不管是閑聊一句還是 Agent 編排指令,物理形態(tài)就是文。「文」不是修飾,是對 prompt 本質(zhì)形態(tài)最直接的命名。
令——命令、指令。Prompt 的功能是驅(qū)動(dòng)模型執(zhí)行。寫下一段文字,模型照著意圖去生成、推理、行動(dòng)。「令」精準(zhǔn)地捕捉了這個(gè)動(dòng)作——人在向模型發(fā)號(hào)施令。
文 = 它是什么(形態(tài))。令 = 它做什么(功能)。
兩個(gè)字,一個(gè)管形態(tài),一個(gè)管功能,各司其職,合起來剛好是 prompt 的完整定義。
像素 · 字節(jié) · 詞元 · 文令,一條從機(jī)器通往人的路
把「文令」放進(jìn)更大的坐標(biāo)系里,會(huì)看到讓人心跳漏半拍的東西:
- 像素(pixel) → 眼睛看見的世界的最小單位
- 字節(jié)(byte) → 機(jī)器存儲(chǔ)的世界的最小單位
- 詞元(token) → 模型理解語言的最小單位
- 文令(prompt) → 人類驅(qū)動(dòng)模型的最小單位
四個(gè)詞,同一套構(gòu)詞邏輯:載體屬性 + 功能屬性。
像素——像(圖像)+ 素(元素)。
字節(jié)——字(文字)+ 節(jié)(片段)。
詞元——詞(詞語)+ 元(原始單位)。
文令——文(文字)+ 令(指令)。
像素離機(jī)器最近,文令離人最近。這背后有一條隱藏的一條進(jìn)化時(shí)間線:從感知,到存儲(chǔ),到理解,到驅(qū)動(dòng)——這是人類一步步將意圖注入機(jī)器的完整進(jìn)程。
相反,如果把「提示詞」放進(jìn)這個(gè)坐標(biāo)系就會(huì)格格不入,它描述的是功能,不是定位,和其他三個(gè)詞不在同一個(gè)維度上,因?yàn)樗脑煸~邏輯從一開始就跑偏了。
![]()
「人工智能」的遺憾,不要再來一次
當(dāng)然有人會(huì)說,叫什么無所謂,大家看得懂就行。
多年前,大概也有人這么評(píng)價(jià)「像素」和「字節(jié)」。但今天,這兩個(gè)詞已經(jīng)成了全民詞匯。你媽媽可能不知道 pixel 的英文拼寫,但她一定知道手機(jī)攝像頭「五千萬像素」。
好的術(shù)語翻譯,是認(rèn)知基礎(chǔ)設(shè)施。 它決定了一個(gè)技術(shù)概念能不能從專業(yè)圈層穿透到大眾理解。
AI 時(shí)代的術(shù)語翻譯窗口不會(huì)一直開著。一旦某個(gè)詞在社交媒體、教科書、產(chǎn)品說明里固化下來,就很難再改了。
現(xiàn)在還來得及。
你看「黑客」的負(fù)面含義在中文里就被徹底固化,結(jié)果我們不得不另造一個(gè)「白帽子」來打補(bǔ)丁。
「人工智能」這四個(gè)字本身也不夠好——「人工」天然暗示「假的、模擬的」,但這個(gè)翻譯已經(jīng)徹底定型了,沒有人有能力再改。「電腦」和「計(jì)算機(jī)」到今天還沒統(tǒng)一,還要再吵多少年不知道。
所幸,Token、「提示詞」還沒有徹底固化。它還在微信群和自媒體里流通,但還沒有被寫進(jìn)國標(biāo),沒有被教科書鎖死。現(xiàn)在提出「詞元」「文令」,是成本最低、阻力最小的時(shí)候。
現(xiàn)在 「詞元」(Token)已經(jīng)被開始被寫入工資單,成為薪酬福利一部分。再等兩年,當(dāng)「提示詞」出現(xiàn)在高考題的閱讀理解里、出現(xiàn)在勞動(dòng)合同的崗位名稱上,那時(shí)候再說就沒用了。
APPSO 不想再經(jīng)歷一次「人工智能」式的遺憾,明明有更好的答案,只是沒人在窗口還開著的時(shí)候大聲說出來。
詞元、文令:請跟我們一起說
Token 就叫詞元。詞,定其形。元,定其根。
Prompt 就叫文令。文,定其意。令,定其魂。
這是 APPSO 的主張,也是 APPSO 的邀請。
我們不是要定義術(shù)語。 術(shù)語由每一個(gè)在文章里寫它、在發(fā)布會(huì)上說它、在課件里用它的人定義。我們做的事,只是在窗口關(guān)閉之前,把一個(gè)更好的選項(xiàng)擺上桌面。
像素讓機(jī)器把畫面給人看。
字節(jié)讓數(shù)據(jù)在機(jī)器之間流動(dòng)。
詞元讓模型讀懂人類的語言。
文令讓人類的意志驅(qū)動(dòng)機(jī)器的智能。
下一次你打開那個(gè)對話框,寫下你想讓 AI 做的事——
你寫下的每一個(gè)字,都是文令。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.