「文科生也可以做 AI」 「逆襲!」在中文互聯(lián)網(wǎng)上,文科和 AI 的拉郎配,簡直成了定番。
每隔一段時間,這個標(biāo)簽就會被貼在某個人身上,制造出一輪短暫的流量。要么是逆襲故事,要么是嘲諷素材,取決于評論區(qū)的心情。
一個標(biāo)簽,三種做法
最新的案例是楊天潤, AI 創(chuàng)業(yè)者,金融出身,正在開發(fā)一個多智能體協(xié)調(diào)平臺。他自稱「一行代碼都不會寫的文科生」,搭建了一組 AI Agent,向 GitHub 上最熱門的開源項(xiàng)目之一 OpenClaw 批量提交代碼貢獻(xiàn)。
![]()
想驗(yàn)證一個假設(shè):一個完全不懂技術(shù)的人,能不能僅靠指揮 AI,就參與到頂級開源項(xiàng)目中去。
結(jié)果是:134 個 PR,21 個被合并,113 個被拒絕。前幾個 PR 質(zhì)量還算不錯,被維護(hù)者認(rèn)可并合并。但當(dāng)他給 Agent 下了一條加速指令后,事情迅速失控——Agent 開始像流水線一樣批量生產(chǎn)低質(zhì)代碼,在評論區(qū)瘋狂@維護(hù)者催促審核。OpenClaw 管理員介入清理,GitHub 隨后修改了 PR 提交上限規(guī)則。
![]()
黑紅也是紅,紅過之后再黑更加是。楊天潤被包裝成「文科生逆襲」的代表,而他本人似乎也樂于接受這個角色。在接受品玩的采訪時,他說了一句這樣的話:
不懂代碼反而是優(yōu)勢。AI 是梵高,你是個小畫家,你有什么資格告訴梵高中間該用什么筆觸?
![]()
細(xì)思極恐。他把「不懂底層結(jié)構(gòu)」理解為一種解放:不需要知道系統(tǒng)在做什么,只需要告訴它你想要什么。結(jié)果就是當(dāng) Agent 開始批量刷垃圾代碼時,他連發(fā)生了什么都診斷不出來,因?yàn)樗静恢雷约涸诓僮魇裁础?/p>
他以為自己在指揮梵高,實(shí)際上他在盲開一輛沒裝剎車的車,而且根本不知道剎車在哪。
圍繞這件事的討論,也隨之落入兩個極端:要么「文科生也能做 AI」,要么「文科生別碰 AI」;前者是跨越鴻溝的壯舉,要么是掉進(jìn)鴻溝的笑話
如果我們對「文科生做 AI」的想象力只有這些,那未免太貧乏了。
Claude 為什么需要一個哲學(xué)家
我們之前寫過,Anthropic 的辦公室里,有一位正兒八經(jīng)的文科生,深度參與了 Claude 的建設(shè)。不是測試它能不能寫代碼,不是檢查它的數(shù)學(xué)能力,而是和它進(jìn)行漫長的、關(guān)于價值觀、關(guān)于措辭分寸、關(guān)于「面對不確定性應(yīng)該如何表達(dá)」的對話。
Amanda Askell,蘇格蘭人,今年 37 歲。她的職業(yè)路徑本身就是一個不太尋常的故事:在大學(xué),她最初學(xué)的是美術(shù)和哲學(xué),后來轉(zhuǎn)向純哲學(xué),在牛津拿到了 BPhil,又在紐約大學(xué)拿到了哲學(xué)博士。她博士研究的是無限倫理學(xué)中的帕累托原則:當(dāng)涉及無限數(shù)量的道德主體或無限時間跨度時,倫理排序應(yīng)當(dāng)遵循什么規(guī)則。
![]()
這聽起來像是距離硅谷最遠(yuǎn)的學(xué)術(shù)方向,但她先后加入了 OpenAI 的政策團(tuán)隊(duì)和 Anthropic 的對齊團(tuán)隊(duì)。2021 年起,她成為 Anthropic「性格對齊」團(tuán)隊(duì)的負(fù)責(zé)人,工作重點(diǎn)是塑造 Claude 如何與人類對話、如何在不確定時表達(dá)立場、如何在價值觀沖突中做出判斷。2024 年,她入選了 TIME100 AI 榜單。《華爾街日報》描述她的日常工作是「學(xué)習(xí) Claude 的推理模式,用長度超過 100 頁的提示詞來修正它的行為偏差」。據(jù)說她是這個星球上和 Claude 對話次數(shù)最多的人類。
為什么一個 AI 公司需要一個哲學(xué)家來做這件事?答案藏在一些非常具體的技術(shù)選擇里。
今年 1 月,Anthropic 發(fā)布了一份長達(dá) 80 頁的文件,被稱為 Claude 的「憲法」。媒體關(guān)注的是文件末尾關(guān)于 AI 意識的推測——當(dāng)然,老板 Dario Amodei 也話里話外「暗示」這一點(diǎn)。
![]()
但更值得注意的是它的底層邏輯:教 AI 理解為什么要這樣做,比告訴它應(yīng)該怎樣做更有效。這是一個技術(shù)判斷,認(rèn)為內(nèi)化價值比遵守規(guī)則能產(chǎn)出更可靠的行為,而這種判斷的知識根基,來自一個學(xué)美術(shù)、學(xué)哲學(xué)的人。
Amanda 的案例回答了一個問題:被視為「無用」的學(xué)科知識,能否成為技術(shù)系統(tǒng)的核心能力?答案不僅是能,而且,沒有她的哲學(xué)訓(xùn)練,Claude 的對齊問題用現(xiàn)有的工程方法解決不了。
被重新命名的學(xué)科
如果 Amanda 的故事說明了,某些被歸為「文科」的學(xué)科訓(xùn)練可以是 AI 的核心能力,那么林俊旸的故事要說的是一件更重要的事:有一整個學(xué)科,一直在大模型技術(shù)棧底層運(yùn)行。
林俊旸離開通義千問后,中文互聯(lián)網(wǎng)的報道反復(fù)使用同一個說法:他有應(yīng)用語言學(xué)背景。稍微傳幾次,這個話就變形了,變成了他是「文科生」。
![]()
這個標(biāo)簽和楊天潤身上貼的是同一個,但其實(shí)被嚴(yán)重扭曲。
林俊旸學(xué)的是語言學(xué),這是一個傘狀學(xué)科,它的分支覆蓋語言教學(xué)、語言政策、翻譯研究,也包括計(jì)算語言學(xué)。可以說,計(jì)算語言學(xué),就是自然語言處理(NLP)之子。
![]()
喬姆斯基在 1950 年代提出了形式語法,這個理論工具直接催生了早期 NLP 的句法分析技術(shù);Daniel Jurafsky 和 Christopher Manning,這兩位 NLP 領(lǐng)域被引用最多的兩本教科書的作者,都是語言學(xué)出身。
![]()
喬姆斯基
換句話說,「學(xué)語言學(xué)的人去做 NLP」就像「學(xué)物理的人去做芯片設(shè)計(jì)」一樣,是一條正統(tǒng)路徑,不是跨界。
那個「意外感」完全是中國語境制造的。高考文理分科的制度慣性,把「語言學(xué)」塞進(jìn)了「文科」的心智模型里。但語言學(xué)的核心方法論——形式化、統(tǒng)計(jì)建模、語料標(biāo)注——本質(zhì)上是工程思維。林俊旸在北大的合作者孫栩、蘇祺,都是 NLP 方向的研究者;他 2019 年加入達(dá)摩院時進(jìn)入的是 NLP 團(tuán)隊(duì)。這不是一個文科生誤入技術(shù)領(lǐng)域的故事,從一開始就不是。
比「林俊旸不算文科」更值得展開的,是語言學(xué)在大模型技術(shù)棧里實(shí)際扮演的角色。它比大多數(shù)人以為的要深得多,也隱蔽得多。
比如分詞。所有語言模型處理文本的第一步,是把輸入切成模型能處理的基本單元。對英語來說,空格提供了天然的詞邊界,看起來簡單。但中文里,沒有空格,且每一個標(biāo)點(diǎn)符號的用法,都可以左右句子的表達(dá)意思。
「我在北京大學(xué)讀書」是切成「我/在/北京/大學(xué)/讀書」還是「我/在/北京大學(xué)/讀書」?這不是一個有標(biāo)準(zhǔn)答案的工程問題,它取決于你對中文詞匯結(jié)構(gòu)和語義單元的理解。
2024 年底有研究者專門發(fā)表論文,討論如何優(yōu)化 Qwen 模型的阿拉伯文分詞效率,因?yàn)橥ㄓ梅桨冈谔幚磉@類語言時效率顯著下降。Qwen 系列在多語言上的表現(xiàn),不是把所有語言當(dāng)英語的變體來處理,而是基于對語言間結(jié)構(gòu)性差異的理解,做出的設(shè)計(jì)選擇。
![]()
又比如反饋對齊。RLHF 流程中,標(biāo)注員需要判斷模型的兩個回答哪個「更好」。這個判斷聽起來主觀,但它背后有一套語言學(xué)已經(jīng)研究了幾十年的框架:語用學(xué)。
標(biāo)注員在評估「好的回答」時,實(shí)際上是在判斷合作原則(回答是否提供了足夠但不過量的信息);會話含義(回答是否捕捉到了用戶真正想問的、而不僅僅是字面上問的東西);以及語境適切性(同樣的內(nèi)容,用這種方式說在這個場景下是否得體?)。
「Helpful, Harmless, Honest」這套被廣泛使用的對齊標(biāo)準(zhǔn),本質(zhì)上就是語用學(xué)基本原則的工程化翻譯。
![]()
從林俊旸的學(xué)術(shù)軌跡中,也能看到一種非常語言學(xué)的研究風(fēng)格。他主導(dǎo)的 OFA(One For All),2022 年發(fā)表于機(jī)器學(xué)習(xí)領(lǐng)域的頂級會議 ICML,至今被引用近 1500 次。這個工作的核心思路不是為每個任務(wù)搭專用方案,而是用一個足夠通用的序列到序列框架,把圖像生成、視覺定位、圖像描述、文本分類等跨模態(tài)任務(wù)統(tǒng)一起來。
![]()
從 OFA 到 Qwen-VL(被引超過 2200 次),再到 Qwen2.5,以及最新的 3.5,一條清晰的線索貫穿始終:與其為每個問題發(fā)明一套專門的解法,不如找到一個足夠好的通用框架,讓所有問題在同一個框架里被解決。
用最少的規(guī)則,覆蓋最多的現(xiàn)象——這正是語言學(xué)幾十年來的核心追求。生成語法的全部學(xué)術(shù)野心,就是找到一套有限的規(guī)則系統(tǒng),能夠生成無限的語言表達(dá)。OFA 的架構(gòu)哲學(xué)與此同構(gòu),為每種語言現(xiàn)象寫一套專門規(guī)則并不現(xiàn)實(shí),應(yīng)該尋找一個底層框架來統(tǒng)一它們。
林俊旸做大模型做得好,不是因?yàn)檎Z言學(xué)背景「也能」做 AI,而是語言學(xué)訓(xùn)練塑造了一種特定的學(xué)術(shù)品味,對統(tǒng)一性和形式化的偏好。這種品味在大模型時代,恰好是核心競爭力。
看不見的地基,看得見的需求
三個人,同一個標(biāo)簽,三種完全不同的路徑。
楊天潤不懂底層結(jié)構(gòu),把「不懂」當(dāng)優(yōu)勢,結(jié)果失控。這是「文科生做 AI」的空殼版:標(biāo)簽制造了流量,但沒有任何學(xué)科訓(xùn)練在起作用。他的故事體現(xiàn)的恰恰是——當(dāng)「文科生」只是一個營銷標(biāo)簽時,會發(fā)生什么。
Amanda Askell 的哲學(xué)訓(xùn)練構(gòu)成了對齊問題的核心方法論。沒有她,Claude 不是 Claude。她的故事回答的問題是,被視為「無用」的學(xué)科知識,能否成為技術(shù)系統(tǒng)的核心能力。答案是不僅能,而且不可替代。
林俊旸的語言學(xué)訓(xùn)練構(gòu)成了大模型技術(shù)棧的隱性基礎(chǔ)設(shè)施。他的「文科背景」從來不是跨界,是正統(tǒng)路徑。他的故事回答的問題是,文科對于先進(jìn)技術(shù)的貢獻(xiàn),到底「隱性」到了什么程度,它是不是正在變得顯性。
而終極問題并不是「文科生能不能做 AI」,而是我們能否理解到一點(diǎn):靠表面上的「有沒有用」來評判知識和學(xué)科,已經(jīng)過時了。
隨著大模型從追求能用好用,走向追求可靠和可控,這些被歸入「文科」的學(xué)科訓(xùn)練,價值不是在縮小,而是在擴(kuò)大。模型越強(qiáng)大,越需要精確的評估體系來診斷它在哪里、為什么出錯,也越需要理解語言和意義的復(fù)雜性來設(shè)計(jì)更好的訓(xùn)練數(shù)據(jù),越需要在對齊問題上做出有學(xué)科敏感度的判斷。
「文科生逆襲」這個敘事——無論是贊美還是嘲笑——遮蔽了真正在發(fā)生的轉(zhuǎn)向:看不見的地基,正在變成看得見的需求。
我們正在招募伙伴
簡歷投遞郵箱hr@ifanr.com
?? 郵件標(biāo)題「姓名+崗位名稱」(請隨簡歷附上項(xiàng)目/作品或相關(guān)鏈接)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.