昨天,陶哲軒在他的個人博客上發布了一則論文更新。他在貼文中寫道,“我很少寫哲學性質的長篇文章,上一次大概是 2007 年。”這位菲爾茲獎得主、加州大學洛杉磯分校數學教授,剛在 arXiv 上傳了一篇題為《人工智能時代的數學方法與人類思維》(Mathematical Methods And Human Thoughts In The Age Of AI) 的論文,論文的合著者是他的多年好友、跨學科學者 Tanya Klowden。
陶哲軒還補充道,這篇論文的撰寫耗時超過一年,或許這聽起來和當今人工智能的發展速度相比有些滯后。但他們想跳出當下人工智能與形式化工具帶來的具體技術問題,而是想把視角聚焦在 AI 與人類智能關系的深度思考:他們的話題非常的廣泛,從古希臘的歐幾里得講到當下的大語言模型,從數學證明的“氣味”談到十九世紀盧德分子砸毀紡織機的往事。論文將作為即將出版的《布萊克威爾數學哲學指南》中的一個章節。
![]()
(來源:陶哲軒個人博客)
過去兩年,陶哲軒對 AI 工具的態度經歷了一次公開的轉變。在2024 年,他曾把使用 AI 做數學比作“指導一個平庸但還算有點能力的研究生”。而到了 2026 年 2 月初,在 UCLA 舉辦的一場名為“用 AI 加速數學與理論物理”的會議上,他的措辭變成了“AI 現在可以正式上場了”,因為它“節省的時間已經超過了它浪費的時間”。
但陶哲軒并沒有因此變成技術樂觀主義的布道者。他依然站在“人”的這一側。這篇新論文試圖回答的問題是:當 AI 可以生成外表光鮮、邏輯上無可挑剔的數學證明時,我們還需要人類數學家做什么?更廣泛地說,當 AI 開始自動化創造過程本身,不只是通訊、計算、排版這些輔助環節,我們該如何重新定義智識工作的價值?
論文的核心論點可以概括為一句話:AI 是人類工具演進的自然延續,但它的發展必須以人為中心。這聽起來像是一句正確但空洞的口號,但陶哲軒和 Klowden 花了相當篇幅來解釋他們所說的“以人為中心”具體意味著什么。
首先是關于數學證明的“氣味”問題。這里的“氣味”可以理解成一種直覺性的體驗,任何一個有經驗的數學家在閱讀一篇論文時,往往在逐行檢查之前就已經對論證的可信度有了直覺判斷。這種直覺來自于證明是否提供了“理解”,不只是顯示假設蘊含結論,還能解釋為什么這種蘊含是可能的,哪些步驟是關鍵的,哪些是常規的。論文引用了著名數學家瑟斯頓(William Thurston)的觀點:好的證明不僅正確,還要提供洞見。
問題在于,當前的形式化驗證系統(如 Lean 或 Rocq)只能檢查證明的邏輯正確性,無法捕捉這種“氣味”。一個 AI 可能產出“無味”的證明,在技術上完美無瑕,卻讓讀者感到莫名不滿,因為它沒有告訴你任何關于更廣泛數學領域的信息。
2024 年國際數學奧林匹克(International Mathematical Olympiad,簡稱 IMO)上,DeepMind 的 AlphaProof 系統解出了包括最難的第六題在內的三道題目,獲得銀牌水平的成績。但陶哲軒在論文中指出,那些 AI 生成的證明“包含大量冗余或難以解釋的步驟”,盡管它們都通過了 Lean 的形式化驗證。
這就引出了論文的第二個關鍵論點:形式化驗證是必要的,但遠遠不夠,翻譯錯誤的風險始終存在。費馬大定理陳述中隱含的假設是自然數從 1 開始而非從 0 開始,一個不加注意的 AI 可能因此“證明”費馬大定理是錯的。更微妙的是,即使在純粹抽象的數學領域,只有一部分論證可以被形式化;圍繞這個核心的是一圈啟發式、經驗性、元數學的推理,這些推理提供了關于論證為何有效、是否可推廣、動機何在的寶貴信息。
這些問題在數學領域已經足夠復雜,推廣到現實世界就更加棘手了。論文用了相當篇幅討論 AI 的社會成本:數據中心的能源和水資源消耗、入門級工作崗位的消失、訓練數據的知識產權爭議、以及“數字鴻溝”。不僅是有 AI 和沒有 AI 的人群之間的差距,還包括被鎖定在不同 AI 生態系統中的研究者之間能力的不均衡。
Tanya Klowden 的加入則讓論文有了更加廣泛的關切。
![]()
圖 | 陶哲軒與 Tanya 合照(來源:Instagram)
她的背景頗為豐富精彩:首先是物理學碩士(研究課題是石墨烯的催化刻蝕)、藝術史碩士(研究 16 世紀西班牙宮廷肖像畫中的合作關系),曾是舞臺設計師,現在是倫敦考陶爾德藝術學院的博士研究生。陶哲軒在博客中稱她為“博學者”(polymath),兩人還合作撰寫了一本關于天文學距離階梯的科普書籍,即將由耶魯大學出版社出版。這種跨學科的組合使得論文能夠在技術細節和人文關懷之間自如切換:從 Lean 證明助手的語法講到十九世紀諾丁漢紡織工人的絕望反抗。
論文中有一個引人注目的類比,現代 AI 的出現類似于天文學中的哥白尼革命,這在陶哲軒在近日接受 Dwarkesh Podcast 采訪也有所提及。在古代地心說模型中,地球享有宇宙中心的特殊本體論地位;歷經幾個世紀的天文學和物理學進步,這種特權被逐步瓦解,取而代之的是哥白尼原理。地球只是無數行星中的一顆,不受自然法則的任何特殊對待。類似地,人類智能長期以來被視為認知宇宙的中心,但現在我們正在發現(或創造)其他與我們在很多方面可比但又截然不同的“智能行星”。
![]()
(來源:Youtube)
這個類比的微妙之處在于:接受地球在宇宙中的平凡地位,并不妨礙我們繼續高度關心地球上發生的事情。同樣,承認人類智能不再是唯一的智能形式,也不意味著我們要放棄對人類認知活動的重視。論文引用了國際象棋的例子:自從 1990 年代人類棋手再也無法戰勝象棋引擎之后,國際象棋非但沒有消亡,反而作為一項人類活動繼續繁榮。棋手們把引擎整合進訓練中,用它來重新審視舊理論、探索新戰術、尋找即使是“不可戰勝”的 AI 也可能存在的弱點。
但論文也承認,這種樂觀的共存場景有賴于一些條件,而這些條件目前遠未得到滿足。作者們明確拒絕了三種極端立場:純粹形式主義(只要符號操作正確就行,不需要理解),人類沙文主義(人類創造力有某種不可言喻的特質是 AI 永遠無法復制的),以及 AI 至上主義(人類認知活動是一種苦差事,應該盡快被自動化取代)。他們認為,在這些極端之間存在哲學上的中間地帶,可以為人與 AI 之間的互補共存提供有用的視角。
具體到當下的實踐建議,論文提出了一個逐步演進的框架。短期內,AI 應該像烘焙中的香草精,適量添加可以提升風味,過量則會毀掉整道菜。中期內,AI 適合扮演“紅隊”角色,負責測試、驗證、檢查人類生成的內容,但不應該在“藍隊”,即核心創作環節和承擔結構性職責。至于長期,論文只是提出了問題而沒有給出答案:如果未來某一天,AI 在所有實際維度上都超越了人類專家,我們將如何應對那些關于智識勞動價值的根本性哲學問題?
陶哲軒在 Dwarkesh 那里接受采訪時曾說,他在 2023 年預測“到 2026 年 AI 將成為數學研究中值得信賴的合著者”,現在他對這個預測感到滿意。但他也坦言,AI 讓他的論文更豐富了,核心突破仍然要靠紙筆完成。AI 擅長廣度,人類擅長深度,二者高度互補;他認為人機混合將在數學領域占據主導地位的時間會比很多人預期的更長。
論文的最后一部分坦率地討論了知識產權和責任歸屬的困境。當 AI 被應用于一個問題時,誰對錯誤負責?誰獲得洞見的榮譽?這兩者可能并不是同一方,甚至可能根本沒有明確定義的“方”。傳統的學術引用系統是否足以處理一個可能有數百或數千個“隱藏”貢獻者的場景?僅僅引用 AI 模型本身是否足夠?論文沒有給出答案,但它指出,隱藏 AI 使用的做法已經在學術界引發了類似于抄襲的強烈反應,這反過來又導致一些從工具中受益的研究者更加隱蔽地使用它們。
在采訪和博客中,陶哲軒反復強調一個觀點:AI 的能力不是一個單一的量。同一個任務,根據你給它多少資源、多少輔助、如何報告結果,AI 的表現可以相差幾個數量級。用他在 Mastodon 上的帖子來說,這就像評估一個人類學生的能力。是讓他在考場上閉卷作答四小時,還是讓他和導師、同學討論幾天再提交論文?兩種場景測試的是完全不同的東西。
這篇論文或許不會改變任何正在進行中的 AI 開發路線圖,但它代表了一種聲音:來自一個在 AI 應用于數學方面走在最前沿的實踐者,卻也愿意停下來問一些不那么容易回答的問題。
在結尾,陶哲軒和 Tanya 在腳注中寫道:“一個著名的 Tumblr 思想實驗得出結論,一塊香草精含量達到 44% 的蛋糕是無法食用的。”盡管我們總是幻想著它更多一點更美味。這就好像目前的 AI 使用,適量添加可以增強和豐富作品,但如果 AI 內容成為核心組成部分,將不會產生理想、有效或有價值的結果。
當前 AI 的使用量或許大概還遠沒到 44%,但在某些領域,例如學生作業、低質量論文、社交媒體內容……這個比例正在快速攀升。因此,論文的立場是,精靈已經出了瓶子,試圖把它塞回去既不現實也可能弊大于利;現在的問題是如何與它共處,同時確保人類的需求、人類的創造力、人類的理解始終處于等式的核心。
1.https://terrytao.wordpress.com/2026/03/29/mathematical-methods-and-human-thought-in-the-age-of-ai/
2.https://arxiv.org/abs/2603.26524
運營/排版:何晨龍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.