![]()
題記:本文是系列文章“AI30講”的第2 篇。
圖靈測試
1950 年,圖靈在他的論文里設計了一個游戲:把你和兩個對話者分別關在三個房間里。你看不見他們,只能通過打字機打出的字條互相交流。
你可以問他們任何問題:“喜歡莎士比亞嗎?”“2+2 等于幾?”“你會做夢嗎?”
這個游戲的關鍵在于,兩個對話者中有一個是機器人,而你的任務就是判斷誰是。
如果你窮盡方法,都分不出來,圖靈的拷問就來了:那個機器人,還能說它“不是人”嗎?
這就是后來大家耳熟能詳的圖靈測試。
圖靈設計它的本意并非定義 AGI,恰恰相反,他認為“機器能思考嗎”這個問題太無聊了,不如換一個可操作的問題:機器能不能在對話中表現得和人類無法區分?
如果外在行為完全一致,內在是什么還重要嗎?
圖靈說,不重要。
“中文房間”
三十年后,哲學家約翰·塞爾不同意。1980 年,他提出了一個叫“中文房間”的思想實驗:
想象你是一個只會說英語的人,被關在一個封閉的房間里。房間里有一本厚厚的規則手冊,全是英文寫的各種規則,比如:如果看到“你好”這兩個符號,就在紙上畫出“您好,有什么可以幫您”這另外幾個符號。
——注意,你不懂中文,“你”、“好”、“有”、“什”、“么”這些符號對你都是天書,你是真的在“畫”。
接下來,外面有人遞進來一張張紙條,上面寫著中文問題。你完全看不懂這些符號是什么意思,但你可以按照手冊的規則,“畫”出對應的中文回復,然后遞回去。
外面的人收到回復,發現回答得非常流暢、得體,完全像一個精通中文的人在對話。但實際上呢?你對中文一無所知。你只是在機械地匹配符號、復制筆畫。
塞爾用這個實驗追問:能說房間里的人“懂中文”嗎?
如果外在行為完全一致,內在是什么還重要嗎?
塞爾說:重要。
行為等價不等于內在等價,即便行為一樣,內核也可能完全是空的。
如果當時圖靈還在世,聰明如他一定會敏銳地抓住塞爾的破綻,逼問道:那么塞爾先生,請你給我講講那本神奇的規則手冊吧。
可惜,當時圖靈已經故去多年。
僅僅又過了兩年,一個商業事件把這場哲學辯論拉進了現實,并直接改變了之后 40 年的個人電腦和軟件工業。
“凈室逆向”
1981 年 8 月,IBM 發布了 IBM PC,迅速統治了個人電腦市場。
IBM 當時做了一個看來非常奇葩的決定:他們把 BIOS 的完整源代碼印在了技術參考手冊里,公開發售。
BIOS 是計算機啟動時第一個運行的程序,是整臺機器的“底座”,有了它就能開發兼容機跟 IBM 搶市場。
那 IBM 為什么要公開它的源代碼?
因為 IBM 想讓開發者了解 IBM PC 的工作原理,好為它開發軟件。軟件越多,IBM PC 賣得越好。
但 IBM 顯然不會允許誰開發兼容機跟自己搶市場,因此同時它用版權法保護 BIOS 源代碼:你可以看,可以學習,可以基于它開發軟件,但你不能復制 BIOS 代碼本身。
誰敢復制這些代碼去做兼容機,IBM 就告誰侵權。
這就像一家餐廳把菜譜貼在墻上,告訴你他們家的食材、工藝有多好,但如果你照著做了一模一樣的菜去賣,就起訴你。
幾個月后,一個特殊的食客走進了 IBM 的“餐廳”,這個食客的名字叫 Compaq(康柏)。
彼時 Compaq 剛剛成立,非常想做 IBM 兼容機,因為一旦做成,就可以無差別運行 IBM PC 上的軟件,獲得整個 PC 生態的紅利。
但 Compaq 跟所有想做兼容機的小廠一樣,都受困于 BOIS。完全獨立開發 BIOS 不現實,但如果直接用 IBM 公開的 BIOS 源碼又會被起訴侵權。
Compaq 發明了一種后來被稱為“凈室逆向工程”的方法,他們把團隊分成兩組:
第一組人閱讀 IBM 的 BIOS 源碼,把它能做的每一件事都寫下來:開機時初始化哪些硬件、響應哪些指令、返回哪些結果。但只寫“它做了什么”,不寫“它怎么做的”。你可以說他們寫得寫一份“BIOS 行為說明書”。
第二組人從頭到尾沒見過 IBM 的一行代碼,也不允許跟第一組人直接交流,只是拿著第一組寫得“BIOS 行為說明書”,從零寫出一個全新的 BIOS。
——你細品,這樣的分組安排像不像圖靈測試?而那本“BIOS 行為說明書”又像不像塞爾的規則手冊?
結果怎么樣?所有 IBM 軟件都能在 Compaq 上運行,Compaq 的兼容機大獲成功。
IBM 怒而起訴,很快敗訴。
法院的判決理由是:既然代碼完全不同,哪怕功能完全一致,這也是合法的新作品而非盜版。
這很符合我們普通人的直覺,但如果圖靈知道了這個判決,恐怕會大搖其頭。
Compaq 的“凈室逆向工程”奠定了整個 IBM 兼容機產業的法律基礎,進而改變了接下來 40 年計算機和軟件行業的走向。
后來的 Phoenix BIOS 甚至敢給客戶承諾 200 萬美元的侵權賠償擔保,以彰顯自身的“合法性”。
不知道是有心還是巧合,Compaq 當初實施“凈室逆向”的成本恰好差不多是 200 萬美元,外加幾個月的開發時間。
那是 1982 年,200 萬美元不是小數目,到了 2026 年,AI 讓同樣的事變成了:一個人、幾個小時、幾乎免費。
這次的故事跟一個你大概率不熟悉的軟件有關,它叫 chardet。
chardet:創造者與守護者,生父與養母
Mark Pilgrim 是互聯網早期最有影響力的程序員之一,《Dive Into Python》的作者,無數開源項目的締造者。
2004 年前后,他基于 Mozilla 的字符檢測算法寫了 chardet,一個判斷文本是什么編碼格式的 Python 庫,這個代碼庫極不起眼,但全世界無數軟件在用。
Mark Pilgrim 給 chardet 選了 LGPL 許可證,這是一種“有條件開源”的許可。簡單說就是:你的項目可以免費用我的代碼,但只要你用了,你的項目也必須開源。
這種“開源傳染”機制,最早由自由軟件運動的發起人 Richard Stallman 在 1980 年代發明,他稱之為“Copyleft”。
它的邏輯基礎很好懂:無論你的軟件外在是做什么用的,但既然你用了我的代碼,那你的項目的內在,就天然的跟之前不一樣了,有屬于我的部分,因此要遵循我的規則。
事情發展到這里并沒有什么不正常,直到 2011 年,Pilgrim 做了一件至今沒人能理解的事:他刪除了自己在互聯網上的一切。他把自己的 GitHub 倉庫、個人博客、所有網站全部清空。他像一個燒掉了自己全部手稿的作家,一夜之間從數字世界消失了。
幸運的是,chardet 因為發布在 PyPI(一個 Python 包倉庫)上,代碼得以保存。但它失去了它的締造者,即將成為沒人維護的孤兒項目。
就在此時,有人接手了 chardet。一個名叫 Dan Blanchard 的普通程序員。不是因為榮耀,而是這個庫太多人在用了,不能沒人管。
然后他一管就管了十四年。
十四年里,Blanchard 修了無數 bug,處理了無數兼容性問題,回答了無數用戶提問。chardet 之所以還能用,是因為他一個人在撐著。
但有一個問題他解決不了:LGPL 許可證。
很多公司因為 LGPL 不敢用 chardet,它的“傳染性”要求所有使用它的代碼也必須開源,這是商業項目不能接受的。
Blanchard 很想把 chardet 的開源許可從 LGPL 換成MIT 許可,后者是一種更寬松的許可:你隨便用、隨便改而且不強制你要開源。
但 Blanchard 沒法這樣做,代碼里有 Pilgrim 寫的原始實現,版權屬于原作者,要修改開源許可,需 Pilgrim 授權,但 Pilgrim 消失了。
我不知道今天的 chardet 有多少代碼還是原作者當初寫的,又有多少是 Blanchard 后來修繕的,但無論怎樣,哪怕作為十四年的維護者,Blanchard 依然沒有權力改變 chardet 的“血統”。
這像什么?像一個孩子,生父失蹤了,養母撫養了他十四年,考慮到孩子未來的發展,養母想給孩子改個戶籍——不行,需要生父同意。
2025 年底,AI 給了 Blanchard 一個新的選項:換血,清除生父的所有基因。
他把 chardet 的 API 接口和測試套件(一個包含約 2,500 個測試文件的集合)扔給 AI,要求很簡單:從零開始寫,不看原代碼,只要通過所有測試。
是的,凈室逆向!
只是這一次換 AI 來做。
AI 很圓滿的完成了任務,新的 chardet 用 JPlag(一個檢查代碼抄襲的工具)檢測,在代碼層面,跟原版沒有任何相似。
不只是“沒有任何相似”,實際上 AI 表現得過于良好,新版比原版更快、支持多核處理、架構更現代。
但功能呢?——所有測試用例全部通過,新的 chardet 跟原來的 chardet 在外在行為上完全一致。
2026 年 3 月(對,就是前幾天),Blanchard 把換血成功的 chardet 的開源許可證改成了 MIT。
僅僅幾天之后,戲劇性的事情發生了,消失了十五年的“生父”Pilgrim 突然出現,提交了一份 GitHub Issue(編號 ),反對這個改動。*
他認為新版本是“派生作品”——測試集里沉淀的是他對字符編碼的理解,他說:你通過我的測試集得到的“新實現”,本質上還是我的智力成果。
“養母”Blanchard 反駁道:新版 chardet 的代碼沒有一行是你寫的,這是全新作品。
生父和養母對戰,這簡直是程序員版的瓊瑤言情小說,你覺得 Pilgrim 和 Blanchard 誰更對?“養大”還是“親大”?
聰明如圖靈,必定會說:既然軟件的行為一樣,那軟件就還是原來那個軟件,我站 Pilgrim。
然后他扭頭望向幾個月前剛剛入住天堂的塞爾(后者于 2025 年 9 月去世):賢弟,你有何高見?
塞爾必定回應到:Pilgrim 的測試集就是我說得那個規則手冊,理所當然的,我也站 Pilgrim。
此話一出,兩個天才齊齊陷入沉默——他們突然意識到,在這個故事里,自己和對方的分歧居然消弭了。
而且情況也許遠比看到的更驚悚:在 chardet 這個故事里,沒有人類,參加“圖靈測試”的雙方不是人類,坐在“中文房間”里查手冊的也不是。
只有 AI。
圖靈想用他的圖靈測試證明,我們無需關注內在,只要外在跟人一樣那就是人。
塞爾想用他的中文房間反駁,哪怕外在跟人一樣,但內在未必是人的靈魂。
但現在,“人”——這個中心點——消!失!了!
圖靈測試的逆運用
其實這里還發生了一件非常微妙的事。
圖靈測試的原本是一個鑒定工具:我不知道墻那邊是不是人,但我可以通過一系列測試題來判斷,ta 的行為跟人一不一樣——如果一樣,我就應該把 ta 看作人。
chardet 的 AI 重寫則是把圖靈測試反過來用。
那 2500 條測試題不再是測試題,而變成了生產藍圖。不是“通過測試來判斷你是不是一樣”,而是“通過測試來制造一個跟你一樣的東西”。
這是圖靈測試的逆運用。
圖靈絕不會想到它能成功,而它一旦成功,一個根本性的翻轉就發生了:
當鑒定工具變成了生產藍圖,當你的全部價值可以被一套測試完整描述,那你就是可以被替換的。
測試即靈魂。
“復制之路”的終結
故事也許比你想象的要宏大得多。
GPL、LGPL 這類“有條件開源”許可證,幾十年來是開源世界的基石。它的規則很精巧:我開源我的代碼,但你用了我的代碼,你也必須開源。
這個規則成立的前提是什么?——復制。
開源→ 被復制代碼 → 觸發版權保護 → 版權保護強制你遵守許可證條款→ 你開源→ ……
整條鏈路動起來,而動力就是“復制”,畢竟,你必須復制我的代碼才能用我的功能。
注意,這里的“必須”不是規則要求,而是因果關系。還有什么比這更加公平、絕對和不證自明的呢?
但現在,AI 把“復制”消滅了。
你不需要復制任何代碼,你只需要知道它在做什么、做得對不對(測試),AI 就能從零寫出一個全新的實現。
沒有復制 → 沒有版權侵犯 → 許可證失效 → 開源鏈條斷裂。
在我看來,這是 AI 投下的又一顆無聲核彈,其影響怎么說都不為過。
如果把整個開源鏈條比作絲綢之路,那復制就是這條鏈路上的奧斯曼帝國,過去的人們無法想象可以不經過奧斯曼帝國穿越歐亞大陸,帝國自己也如此堅定地認為:“欲去那東方,畢經過我的城邑,服從我的條件,留下你的稅錢。”
然后,歐洲人發現了好望角。
航線遠了十倍,但商人們很快意識到,繞路的總成本反而更低。絲綢之路上的帝國,一夜之間從“不可繞過”變成了“無人經過”,帝國逐漸衰落,陸上絲路斷絕,歐亞大陸格局和東西方史均被改寫。
我用奧斯曼帝國的隕落來類比,本意是想讓你感受一下這件事有多大,但寫完我才意識到,帝國的分量依然不夠。
注意,這里的一個細節:“繞路比直達成本更低”——當生成比復制的成本更低,這意味著什么?請容許我提醒你一下:生命的本質是復制。
至少我們曾經這么認為。
“背刺之路”開端
如果說 chardet 的故事是言情劇,還閃爍著人性的光輝和狗血,那接下來的故事則像是命運寫的段子,讓圖靈嘆息、塞爾流淚。
這次的主角是 Vercel,估值 93 億美金科技巨頭,如果你經常用 AI 建站,你應該對它很熟悉。
它是 Next.js 的開發者,一個全球最流行的 Web 開發框架,數百萬開發者的首選。
他們的 CTO Malte Ubl 在 2025 年主導了一個叫 just-bash 的項目:用 AI 重寫 Unix 操作系統里的那些工具——grep、sed、awk、jq。
這些工具誕生于 1970 年代,是 Unix 哲學的圖騰,曾被無數程序員視為不可替代。
Vercel 對此很得意,CTO 親自在 Twitter 上宣傳:“看,AI 可以重寫四十年的經典工具。”
這既是自身技術實力的彰顯,更是對 AI 編程的絕佳廣告。
然而短短幾個月之后,2026 年 2 月,Cloudflare——Vercel 最大的競爭對手——就拿著同一把劍,捅向了 Vercel 的菊花心臟。
Cloudflare 啟動了一個叫 vinext 的項目:用 AI 重寫了 Next.js 94% 的核心功能。
花了多少錢?1100 美元。多少長時間?一周。
但你知道 Vercel 花了多少年打造 Next.js 嗎?將近十年,數百名工程師,累計投入數億。
Vercel 直接急了,但又不知道怎么罵才顯得自己不像小丑,于是只能暗搓搓的批評 vinext“不夠成熟”、“細節處理不夠到位”、“沒有配套的生態和社區”。
每一條批評都是對,但每一條也可以原封不動地用來批評他們自己的 just-bash——那些被重寫的 Unix 工具同樣經歷了四十年的細節打磨,有龐大的生態和社區。
AI 重寫能力就是這個時代的回旋鏢,人人都有,人人都怕。你用來攻擊別人時覺得天經地義,被別人用來攻擊你時覺得天理難容。
Vercel 的 CTO 在 Twitter 上的炫耀,成了 Cloudflare 最好的招聘廣告:“Vercel 說 AI 可以重寫一切,而我們用 AI 重寫 Vercel。”
就是不知道,接下來 Cloudflare 又會被誰重寫呢?
螳螂捕蟬黃雀在后,這出背刺的鏈條,環環相扣。
“中文房間”的追問,圖靈測試的反噬
讓我們再次回到塞爾的中文房間。
塞爾在 1980 年說:房間里的人不懂中文,但他卻可以通過查手冊,回答得像懂中文的人一樣好,因此,行為等價并不等于本質等價。
但聰明如你,一定注意到了,chardet 的故事給這個思想實驗加了一個連塞爾也沒有預料到的升級版:
如果不是“一樣好”,而是更好呢?
還記得我前面說得嗎?新版 chardet 比原版更快、支持多核處理、架構更現代。
AI 不“懂”字符編碼,它沒有 Mark Pilgrim 那二十年對字符編碼的深入理解,沒有他在 Mozilla 源代碼里摸爬滾打積累的經驗,沒有他對 UTF-8、GB2312、Shift-JIS 這些編碼標準的歷史脈絡的掌握。但 AI 寫出來的新 chardet 更快、更準確、架構更優雅。
Pilgrim 花了二十年理解一個領域,寫出了 chardet。AI 沒有理解這個領域,卻寫出了更好的 chardet。
塞爾的中文房間本質是在追問“理解是否存在”,2026 年追問變的更加尖銳且現實:理解還值錢嗎?
如果一個不理解你領域的 AI 可以產出比你更好的成果,你的那份“理解”在市場上還有溢價嗎?
你可能會反駁,不!誰說 AI 不理解的?它通過海量的訓練數據,輕松超越了 Pilgrim 對相關領域的理解。
我認為你說得對,但你的說得更殘酷,再來看看圖靈測試:
圖靈測試其實有一個隱含的人本位視角,你是測試者,你占據主動,被測者最多表現得跟你一樣,而且在這種情況下,你還可以給對方頒獎,賦予對方“人權”。(呵呵自大的人類啊!)
但是,如果你發現測試對象比你自己更像人,更理解人類的行為呢?
誰才是那個被測試者?誰才是真正的人?
什么才是真正不可復制的?
chardet 的故事沒有發生在過去,也沒有發生在未來,就在當下。
它在開源社群里引發了廣泛的討論:當代碼可以重寫,功能可以復現,測試可以通過,那什么不能?
Armin Ronacher——Flask 和 Jinja2 的作者,在開源社區說話有分量的人——給出了他的答案:品牌。
他說:“就以我的 Flask 為例,早晚會有人用 AI 重寫一個功能相同的 Web 框架,但 Flask 之所以是 Flask,是因為”Flask“這個名字背后有十幾年積累的文檔生態、社區信任和開發者習慣。
你可以用 AI 重寫一個功能完全一樣的框架,但你不能叫它 Flask。你只能叫它別的名字——比如‘Bottle’或者‘Chalice’。然后你會發現,沒有人搜索‘Bottle 教程’,沒有人在 Stack Overflow 上問‘Chalice 怎么部署’,沒有人寫‘從 Django 遷移到 Chalice’的教程。“
也許是東西方思維習慣的不同,當看到這個高贊回答時,我只想笑,在絕對的優勢面前,再厚的品牌忠誠度都會脆弱的像一層窗戶紙。
還拿 charlet 來舉例,新版 chardet 的下載量在三個月內超過了原版二十年的總和。
這顯然不是因為 chardet 還是叫“chardet”,否則為啥它原來叫 chardet 的時候,沒這個下載量呢?
恰恰相反,我認為,這是“養母”Blanchard 的慈悲,他完全可以另起一個名字,新產品的下載量絕不對低,而 chardet 這個名字將淹沒在歷史塵埃里,但他沒有這么做,他延續了它。
但笑了十分鐘后,我再一想,Armin Ronacher 也不是全無道理。只是真正的品牌也許不是 chardet 這個名字,而是這段跨越 22 年的歷史:它由 Pilgrim 開啟,再由 Blanchard 接續。
試想一下,如果不是 Blanchard,而是別的人用 AI 重寫了 chardet,用戶會立即蜂擁下載嗎?會立即無條件相信“新版更好”嗎?
這個世界上,只有 Blanchard 可以在用 AI 重寫 chardet 后,讓人們立馬相信他說的話,“這是更好的 chardet”;只有 Blanchard 可以讓改寫后的產品依然叫原名,換個人一定被罵無恥。
同樣的,也只有 Pilgrim 可以質疑 Blanchard 的重寫行為——換任何其他人,都會被斥責為多管閑事。
這 22 年的歷史,是關于質量、責任和信任的故事,中間有無數個用戶做了見證。
這就像那個科幻故事:復制人到你家里,想要取代你,他長得跟你一樣,基因跟你一樣,行為跟你一樣,記憶跟你一樣。但知道真相后,你的家人義無反顧的選擇了你,因為哪怕什么都一樣,卻只有你是真正陪他們度過了往昔歲月——你才是真正的“你”,這跟復制無關,只跟經歷、故事有關。
這也是我不止一次在 MindCode 的文章和閉門會上說過的那句話:“你唯一的、不可剝奪的優勢就是——除了你自己,沒人像你這樣活過一次。”
在時光機被發明之前,在熱力學第二定律被推翻之前,這條法則永遠成立。
而愛因斯坦說,熱力學第二定律是唯一他確信“永不會被推翻”的物理定律。
令人恐懼的熵增,原來是一種慈悲,是我們唯一身份的錨點。
它說:昨日之日不可在,這種絕對的不可復制性,鑄就了你我的唯一性。
尾聲:水中倒影與莊周夢蝶
當你隨著我的文字,從圖靈的測試一路走進塞爾的中文房間,從 IBM、Compaq 走向 chardet、vercel,然后一個轉身再走向關于生命、存在、復制與本質的探討。
我不知道你有沒有一種感覺,那些科幻的、哲學的議題,正在以史無前例的速度變成我們真實生活的一部分。
圖靈和塞爾原本的哲學問題,在今天變成了真實的商業問題,并且超出了兩位大師當年設想的范疇,是當年的升級版。
我不知道當看到我說“昨日之日不可在,這種不可復制性,鑄就了你我的唯一性” 時,你是不是松了一口氣?
但請允許我再狠心推你一把:是的,你的經歷塑造了你的唯一性,但如果記憶可以復制,你又怎么確信你的經歷,真的是你的經理呢?
——你會不會才是那個復制人呢?
2019年馬斯克接受過一段采訪,被問到的最后一個問題是:如果 AGI 被你或別人實現了,你可以向她(AGI)提一個問題,你會問什么?
馬斯克沉默良久,回答道:“What’s Outside the Simulation?” *
(完)
*1 有人懷疑新近出現的Pilgrim并非本人,但社區中的大部分成員已默認其就是本人。
*2 馬斯克堅信這個宇宙是計算模擬出來的,因此他才會在追問,模擬(simulation)之外是什么?
*3 本文成稿(配圖除外)AI 含量0%。
掃碼加入MindCode企圖心俱樂部成為會員,解鎖屬于你的AI時代:
俱樂部分Pro/Plus兩個版本,詳情:。
文君是誰?科技領域連續創業者,目前在AI+心理領域創業,中美幾家AI公司的CEO心智與戰略教練,原阿里巴巴早期移動端核心產品負責人。
MindCode是什么?一個小眾公眾號,日常短篇+偶爾深度長文。關注AI、腦科學、心理學、創業。因在多領域深入思考,關注者中不乏頂級牛人。MindCode企圖心俱樂部正在招募中。
AI時代,讀他人之未讀對你很重要。關注并發送“1”可加討論小群,還可參加“讀完周報再來聊聊”的閉門交流會。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.