編輯|Panda
「震驚!震驚!」
是什么讓著名計算機科學家和數學家、《計算機程序設計藝術》作者、圖靈獎得主高德納(Donald Knuth)發出了如此驚呼?
![]()
圖片由 AI 生成
你沒有猜錯,正是AI
在他近期在斯坦福大學官網上公布的一篇論文《Claude’s Cycles》中,開篇的「Shock! Shock!」非常直白地表達了他對于 AI 強大能力的震驚。
![]()
論文地址:https://cs.stanford.edu/~knuth/papers/claude-cycles.pdf
緊接著他便寫到:「我昨天得知,我已經研究了幾周的一個開放性問題剛剛被 Claude Opus 4.6——Anthropic 公司三周前發布的混合推理模型 —— 解決了!看來我得在某個時候重新審視我對『生成式 AI』的看法了。不僅我的猜想有了一個不錯的解決方案,而且這標志著自動推理和創造性問題解決領域的巨大進步,這真是一件令人高興的事。我會在這篇短文中簡要講述這個過程。」
此事引發了廣泛關注,網友們紛紛點評,感嘆新時代的到來。
![]()
![]()
這是 Hacker News 用戶 Ian Danforth 給出的太長不讀版本:高德納提出一個問題,他的朋友借助 Claude 進行了 30 多次探索,在人類的仔細指導下,Claude 最終編寫了一個 Python 程序,能夠為所有奇數找到解。高德納隨后為該方法撰寫了證明,并對 Claude 的貢獻感到非常滿意。偶數情況仍是未解之謎(Claude 在這方面未能取得太大進展)。
![]()
困擾算法泰斗的圖論難題
高德納在為《計算機程序設計藝術》未來卷撰寫關于有向哈密頓環的內容時,遇到了一個棘手的開放性問題。
具體而言,需要考慮一個具有 m3 個頂點的有向圖,頂點坐標記為 ijk,其中 0≦ i, j, k
2 的情況。
高德納此前已經解決了 m=3 的基礎情況,并將其作為書中的一道練習題。他的朋友 Filip Stappers 隨后通過實驗發現了 4≦ m≦16 的解,這使得所需分解法存在的可能性極高。為了尋找通解,Stappers 將這個問題原封不動地交給了 Claude 處理。
31 步探索:AI 的解題邏輯
在交互過程中,Stappers 對 Claude 設定了嚴格的規則指令:
- 在運行完任何探測代碼后,必須立即更新 plan.md 文件。
- 在記錄完成之前,絕對不允許開始下一步的探索。
Claude 采取了多種數學工具進行嘗試。它最初嘗試了簡單的線性與二次函數,但均未奏效。接著,它嘗試使用暴力深度優先搜索,最終因為搜索空間過大而放棄。隨后,它引入了「2D 蛇形分析」,并準確識別出該有向圖是一個帶有兩個生成元的凱萊圖(Cayley digraph)。
問題的突破發生在后半程的探索中:
- 在第 15 次探索時,Claude 引入了「纖維分解」框架,將問題轉化為在坐標上選擇算子的排列組合。
- 在第 25 次探索后,它自主得出結論,認為模擬退火算法雖然能找到解,卻無法給出通用構造,此時需要純粹的數學推導。
- 最終在第 31 次探索時,Claude 注意到每個纖維的選擇僅依賴于單個坐標,并據此給出了一個具體的 Python 構造程序,成功得出了 m=3, 5, 7, 9, 11 的完美分解方案。
![]()
簡化版的 Python 程序,用 C 語言形式寫的
嚴謹的數學證明與偶數域的挑戰
得出構造代碼僅僅是第一步。Stappers 驗證了 3 到 101 之間所有奇數 m 的情況,均獲得了完美的分解方案。隨后,高德納接手進行了嚴謹的數學證明。他詳細推導了生成的第一個環包含所有具備相同特征的 m2 個頂點,從而證實其長度確為 m3,是一個真正的哈密頓環。
高德納進一步研究發現,在所有類似 Claude 生成邏輯的分解法中,恰好有 760 種對所有奇數 m>1 均有效的解。Claude 憑借自身推導準確找到了其中的一種。
目前,偶數 m 的情況依然懸而未決。
- Claude 在探索中曾找到 m=4, 6, 8 的解,但未能發現其中的通用規律。
- 當被要求繼續攻克偶數情況時,Claude 陷入了困境,后續甚至無法正確編寫探索程序。
- 另一位研究者 Ho Boon Suan 借助 gpt-5.3-codex 生成了處理大于 8 的偶數 m 的代碼,并在高達 m=2000 的規模下測試成功。
- 但由于其模式過于復雜,目前人工證明其正確性的難度極大。
在 Hacker News 和 Reddit 等技術社區中,開發者們普遍認為這次事件的核心意義在于,AI 在數學輔助證明中展現出了自主更換探索工具、排查無效路徑的能力。
正如高德納在文末所感嘆的那樣,克勞德?香農(Claude Shannon)在天之靈若能知曉他的名字與此類進步聯系在一起,定會感到驕傲。
Hats off to Claude!
AI 進軍數學殿堂:從競賽奪金到前沿探索
高德納的驚嘆并非孤例。事實上,在過去的一年多時間里, AI 在解決復雜數學和邏輯問題上已經取得了多個具有實質性意義的突破。
- 國際奧數突破:2025 年 7 月,Google DeepMind 發布的 Gemini(Deep Think 模式)在 IMO 試題評測中達到金牌標準成績,取得 35 分,并能在接近正式考試條件下輸出完整自然語言證明。與此同時,OpenAI 也披露其內部模型達到了類似水平,但官方認證與評測細節相對有限。
- 編程競賽能力躍升:2025 年 9 月,OpenAI 和 Gemini 都聲稱達到了 ICPC 金牌水平,能夠在嚴格時間限制內解決高難度算法問題。不過,這些成績主要來自平行測試或基準評估,并非以正式參賽身份在 International Collegiate Programming Contest 中獲得官方金牌。
- 從解題到科研協作:如今,AI 在科研中的角色顯著增強。模型開始借助外部工具參與數學研究與問題驗證,在復雜猜想與定理探索中發揮輔助作用。例如, GPT-5.2 借助外部工具,協助數學家解決了數個懸而未決的 Erd?s 猜想,并得到了著名數學家陶哲軒的驗證。部分系統已展示出生成研究草稿與進行結構化推理的能力。
驅動這些突破的核心機制也發生了改變。 AI 開始減少對單次快速生成的依賴。現在的模型普遍采用「測試時計算擴展」或「慢思考」策略。通過在推理階段投入更多算力,模型能夠并行探索多條解題路徑并進行嚴格的自我驗證。
展望未來, AI 與數學的結合將突破封閉環境下的標準化考題。隨著自然語言理解力與形式化邏輯的深度融合,AI 將成為數學家與工程師身邊得力的合作者,幫助人類共同攻克那些停滯多年的科學難題。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.