文科生真能靠 AI 逆襲，但和朋友圈刷屏的爽文不一樣

2026-03-15 17:04:33　來源: AppSo

廣東舉報

分享至

「文科生也可以做 AI」「逆襲！」在中文互聯(lián)網(wǎng)上，文科和 AI 的拉郎配，簡直成了定番。

每隔一段時間，這個標(biāo)簽就會被貼在某個人身上，制造出一輪短暫的流量。要么是逆襲故事，要么是嘲諷素材，取決于評論區(qū)的心情。

一個標(biāo)簽，三種做法

最新的案例是楊天潤， AI 創(chuàng)業(yè)者，金融出身，正在開發(fā)一個多智能體協(xié)調(diào)平臺。他自稱「一行代碼都不會寫的文科生」，搭建了一組 AI Agent，向 GitHub 上最熱門的開源項(xiàng)目之一 OpenClaw 批量提交代碼貢獻(xiàn)。

想驗(yàn)證一個假設(shè)：一個完全不懂技術(shù)的人，能不能僅靠指揮 AI，就參與到頂級開源項(xiàng)目中去。

結(jié)果是：134 個 PR，21 個被合并，113 個被拒絕。前幾個 PR 質(zhì)量還算不錯，被維護(hù)者認(rèn)可并合并。但當(dāng)他給 Agent 下了一條加速指令后，事情迅速失控——Agent 開始像流水線一樣批量生產(chǎn)低質(zhì)代碼，在評論區(qū)瘋狂@維護(hù)者催促審核。OpenClaw 管理員介入清理，GitHub 隨后修改了 PR 提交上限規(guī)則。

黑紅也是紅，紅過之后再黑更加是。楊天潤被包裝成「文科生逆襲」的代表，而他本人似乎也樂于接受這個角色。在接受品玩的采訪時，他說了一句這樣的話：

不懂代碼反而是優(yōu)勢。AI 是梵高，你是個小畫家，你有什么資格告訴梵高中間該用什么筆觸？

細(xì)思極恐。他把「不懂底層結(jié)構(gòu)」理解為一種解放：不需要知道系統(tǒng)在做什么，只需要告訴它你想要什么。結(jié)果就是當(dāng) Agent 開始批量刷垃圾代碼時，他連發(fā)生了什么都診斷不出來，因?yàn)樗静恢雷约涸诓僮魇裁础?/p>

他以為自己在指揮梵高，實(shí)際上他在盲開一輛沒裝剎車的車，而且根本不知道剎車在哪。

圍繞這件事的討論，也隨之落入兩個極端：要么「文科生也能做 AI」，要么「文科生別碰 AI」；前者是跨越鴻溝的壯舉，要么是掉進(jìn)鴻溝的笑話

如果我們對「文科生做 AI」的想象力只有這些，那未免太貧乏了。

Claude 為什么需要一個哲學(xué)家

我們之前寫過，Anthropic 的辦公室里，有一位正兒八經(jīng)的文科生，深度參與了 Claude 的建設(shè)。不是測試它能不能寫代碼，不是檢查它的數(shù)學(xué)能力，而是和它進(jìn)行漫長的、關(guān)于價值觀、關(guān)于措辭分寸、關(guān)于「面對不確定性應(yīng)該如何表達(dá)」的對話。

Amanda Askell，蘇格蘭人，今年 37 歲。她的職業(yè)路徑本身就是一個不太尋常的故事：在大學(xué)，她最初學(xué)的是美術(shù)和哲學(xué)，后來轉(zhuǎn)向純哲學(xué)，在牛津拿到了 BPhil，又在紐約大學(xué)拿到了哲學(xué)博士。她博士研究的是無限倫理學(xué)中的帕累托原則：當(dāng)涉及無限數(shù)量的道德主體或無限時間跨度時，倫理排序應(yīng)當(dāng)遵循什么規(guī)則。

這聽起來像是距離硅谷最遠(yuǎn)的學(xué)術(shù)方向，但她先后加入了 OpenAI 的政策團(tuán)隊(duì)和 Anthropic 的對齊團(tuán)隊(duì)。2021 年起，她成為 Anthropic「性格對齊」團(tuán)隊(duì)的負(fù)責(zé)人，工作重點(diǎn)是塑造 Claude 如何與人類對話、如何在不確定時表達(dá)立場、如何在價值觀沖突中做出判斷。2024 年，她入選了 TIME100 AI 榜單。《華爾街日報》描述她的日常工作是「學(xué)習(xí) Claude 的推理模式，用長度超過 100 頁的提示詞來修正它的行為偏差」。據(jù)說她是這個星球上和 Claude 對話次數(shù)最多的人類。

為什么一個 AI 公司需要一個哲學(xué)家來做這件事？答案藏在一些非常具體的技術(shù)選擇里。

今年 1 月，Anthropic 發(fā)布了一份長達(dá) 80 頁的文件，被稱為 Claude 的「憲法」。媒體關(guān)注的是文件末尾關(guān)于 AI 意識的推測——當(dāng)然，老板 Dario Amodei 也話里話外「暗示」這一點(diǎn)。

但更值得注意的是它的底層邏輯：教 AI 理解為什么要這樣做，比告訴它應(yīng)該怎樣做更有效。這是一個技術(shù)判斷，認(rèn)為內(nèi)化價值比遵守規(guī)則能產(chǎn)出更可靠的行為，而這種判斷的知識根基，來自一個學(xué)美術(shù)、學(xué)哲學(xué)的人。

Amanda 的案例回答了一個問題：被視為「無用」的學(xué)科知識，能否成為技術(shù)系統(tǒng)的核心能力？答案不僅是能，而且，沒有她的哲學(xué)訓(xùn)練，Claude 的對齊問題用現(xiàn)有的工程方法解決不了。

被重新命名的學(xué)科

如果 Amanda 的故事說明了，某些被歸為「文科」的學(xué)科訓(xùn)練可以是 AI 的核心能力，那么林俊旸的故事要說的是一件更重要的事：有一整個學(xué)科，一直在大模型技術(shù)棧底層運(yùn)行。

林俊旸離開通義千問后，中文互聯(lián)網(wǎng)的報道反復(fù)使用同一個說法：他有應(yīng)用語言學(xué)背景。稍微傳幾次，這個話就變形了，變成了他是「文科生」。

這個標(biāo)簽和楊天潤身上貼的是同一個，但其實(shí)被嚴(yán)重扭曲。

林俊旸學(xué)的是語言學(xué)，這是一個傘狀學(xué)科，它的分支覆蓋語言教學(xué)、語言政策、翻譯研究，也包括計(jì)算語言學(xué)。可以說，計(jì)算語言學(xué)，就是自然語言處理（NLP）之子。

喬姆斯基在 1950 年代提出了形式語法，這個理論工具直接催生了早期 NLP 的句法分析技術(shù)；Daniel Jurafsky 和 Christopher Manning，這兩位 NLP 領(lǐng)域被引用最多的兩本教科書的作者，都是語言學(xué)出身。

喬姆斯基

換句話說，「學(xué)語言學(xué)的人去做 NLP」就像「學(xué)物理的人去做芯片設(shè)計(jì)」一樣，是一條正統(tǒng)路徑，不是跨界。

那個「意外感」完全是中國語境制造的。高考文理分科的制度慣性，把「語言學(xué)」塞進(jìn)了「文科」的心智模型里。但語言學(xué)的核心方法論——形式化、統(tǒng)計(jì)建模、語料標(biāo)注——本質(zhì)上是工程思維。林俊旸在北大的合作者孫栩、蘇祺，都是 NLP 方向的研究者；他 2019 年加入達(dá)摩院時進(jìn)入的是 NLP 團(tuán)隊(duì)。這不是一個文科生誤入技術(shù)領(lǐng)域的故事，從一開始就不是。

比「林俊旸不算文科」更值得展開的，是語言學(xué)在大模型技術(shù)棧里實(shí)際扮演的角色。它比大多數(shù)人以為的要深得多，也隱蔽得多。

比如分詞。所有語言模型處理文本的第一步，是把輸入切成模型能處理的基本單元。對英語來說，空格提供了天然的詞邊界，看起來簡單。但中文里，沒有空格，且每一個標(biāo)點(diǎn)符號的用法，都可以左右句子的表達(dá)意思。

「我在北京大學(xué)讀書」是切成「我/在/北京/大學(xué)/讀書」還是「我/在/北京大學(xué)/讀書」？這不是一個有標(biāo)準(zhǔn)答案的工程問題，它取決于你對中文詞匯結(jié)構(gòu)和語義單元的理解。

2024 年底有研究者專門發(fā)表論文，討論如何優(yōu)化 Qwen 模型的阿拉伯文分詞效率，因?yàn)橥ㄓ梅桨冈谔幚磉@類語言時效率顯著下降。Qwen 系列在多語言上的表現(xiàn)，不是把所有語言當(dāng)英語的變體來處理，而是基于對語言間結(jié)構(gòu)性差異的理解，做出的設(shè)計(jì)選擇。

又比如反饋對齊。RLHF 流程中，標(biāo)注員需要判斷模型的兩個回答哪個「更好」。這個判斷聽起來主觀，但它背后有一套語言學(xué)已經(jīng)研究了幾十年的框架：語用學(xué)。

標(biāo)注員在評估「好的回答」時，實(shí)際上是在判斷合作原則（回答是否提供了足夠但不過量的信息）；會話含義（回答是否捕捉到了用戶真正想問的、而不僅僅是字面上問的東西）；以及語境適切性（同樣的內(nèi)容，用這種方式說在這個場景下是否得體？）。

「Helpful， Harmless， Honest」這套被廣泛使用的對齊標(biāo)準(zhǔn)，本質(zhì)上就是語用學(xué)基本原則的工程化翻譯。

從林俊旸的學(xué)術(shù)軌跡中，也能看到一種非常語言學(xué)的研究風(fēng)格。他主導(dǎo)的 OFA（One For All），2022 年發(fā)表于機(jī)器學(xué)習(xí)領(lǐng)域的頂級會議 ICML，至今被引用近 1500 次。這個工作的核心思路不是為每個任務(wù)搭專用方案，而是用一個足夠通用的序列到序列框架，把圖像生成、視覺定位、圖像描述、文本分類等跨模態(tài)任務(wù)統(tǒng)一起來。

從 OFA 到 Qwen-VL（被引超過 2200 次），再到 Qwen2.5，以及最新的 3.5，一條清晰的線索貫穿始終：與其為每個問題發(fā)明一套專門的解法，不如找到一個足夠好的通用框架，讓所有問題在同一個框架里被解決。

用最少的規(guī)則，覆蓋最多的現(xiàn)象——這正是語言學(xué)幾十年來的核心追求。生成語法的全部學(xué)術(shù)野心，就是找到一套有限的規(guī)則系統(tǒng)，能夠生成無限的語言表達(dá)。OFA 的架構(gòu)哲學(xué)與此同構(gòu)，為每種語言現(xiàn)象寫一套專門規(guī)則并不現(xiàn)實(shí)，應(yīng)該尋找一個底層框架來統(tǒng)一它們。

林俊旸做大模型做得好，不是因?yàn)檎Z言學(xué)背景「也能」做 AI，而是語言學(xué)訓(xùn)練塑造了一種特定的學(xué)術(shù)品味，對統(tǒng)一性和形式化的偏好。這種品味在大模型時代，恰好是核心競爭力。

看不見的地基，看得見的需求

三個人，同一個標(biāo)簽，三種完全不同的路徑。

楊天潤不懂底層結(jié)構(gòu)，把「不懂」當(dāng)優(yōu)勢，結(jié)果失控。這是「文科生做 AI」的空殼版：標(biāo)簽制造了流量，但沒有任何學(xué)科訓(xùn)練在起作用。他的故事體現(xiàn)的恰恰是——當(dāng)「文科生」只是一個營銷標(biāo)簽時，會發(fā)生什么。

Amanda Askell 的哲學(xué)訓(xùn)練構(gòu)成了對齊問題的核心方法論。沒有她，Claude 不是 Claude。她的故事回答的問題是，被視為「無用」的學(xué)科知識，能否成為技術(shù)系統(tǒng)的核心能力。答案是不僅能，而且不可替代。

林俊旸的語言學(xué)訓(xùn)練構(gòu)成了大模型技術(shù)棧的隱性基礎(chǔ)設(shè)施。他的「文科背景」從來不是跨界，是正統(tǒng)路徑。他的故事回答的問題是，文科對于先進(jìn)技術(shù)的貢獻(xiàn)，到底「隱性」到了什么程度，它是不是正在變得顯性。

而終極問題并不是「文科生能不能做 AI」，而是我們能否理解到一點(diǎn)：靠表面上的「有沒有用」來評判知識和學(xué)科，已經(jīng)過時了。

隨著大模型從追求能用好用，走向追求可靠和可控，這些被歸入「文科」的學(xué)科訓(xùn)練，價值不是在縮小，而是在擴(kuò)大。模型越強(qiáng)大，越需要精確的評估體系來診斷它在哪里、為什么出錯，也越需要理解語言和意義的復(fù)雜性來設(shè)計(jì)更好的訓(xùn)練數(shù)據(jù)，越需要在對齊問題上做出有學(xué)科敏感度的判斷。

「文科生逆襲」這個敘事——無論是贊美還是嘲笑——遮蔽了真正在發(fā)生的轉(zhuǎn)向：看不見的地基，正在變成看得見的需求。

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標(biāo)題「姓名+崗位名稱」（請隨簡歷附上項(xiàng)目/作品或相關(guān)鏈接）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.