337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

高德納:「震驚!震驚!」Claude破解《計算機程序設計藝術》難題

0
分享至

編輯|Panda

「震驚!震驚!」

是什么讓著名計算機科學家和數學家、《計算機程序設計藝術》作者、圖靈獎得主高德納(Donald Knuth)發出了如此驚呼?



圖片由 AI 生成

你沒有猜錯,正是AI

在他近期在斯坦福大學官網上公布的一篇論文《Claude’s Cycles》中,開篇的「Shock! Shock!」非常直白地表達了他對于 AI 強大能力的震驚。



論文地址:https://cs.stanford.edu/~knuth/papers/claude-cycles.pdf

緊接著他便寫到:「我昨天得知,我已經研究了幾周的一個開放性問題剛剛被 Claude Opus 4.6——Anthropic 公司三周前發布的混合推理模型 —— 解決了!看來我得在某個時候重新審視我對『生成式 AI』的看法了。不僅我的猜想有了一個不錯的解決方案,而且這標志著自動推理和創造性問題解決領域的巨大進步,這真是一件令人高興的事。我會在這篇短文中簡要講述這個過程。」

此事引發了廣泛關注,網友們紛紛點評,感嘆新時代的到來。





這是 Hacker News 用戶 Ian Danforth 給出的太長不讀版本:高德納提出一個問題,他的朋友借助 Claude 進行了 30 多次探索,在人類的仔細指導下,Claude 最終編寫了一個 Python 程序,能夠為所有奇數找到解。高德納隨后為該方法撰寫了證明,并對 Claude 的貢獻感到非常滿意。偶數情況仍是未解之謎(Claude 在這方面未能取得太大進展)。



困擾算法泰斗的圖論難題

高德納在為《計算機程序設計藝術》未來卷撰寫關于有向哈密頓環的內容時,遇到了一個棘手的開放性問題。

具體而言,需要考慮一個具有 m3 個頂點的有向圖,頂點坐標記為 ijk,其中 0≦ i, j, k

2 的情況。

高德納此前已經解決了 m=3 的基礎情況,并將其作為書中的一道練習題。他的朋友 Filip Stappers 隨后通過實驗發現了 4≦ m≦16 的解,這使得所需分解法存在的可能性極高。為了尋找通解,Stappers 將這個問題原封不動地交給了 Claude 處理。

31 步探索:AI 的解題邏輯

在交互過程中,Stappers 對 Claude 設定了嚴格的規則指令:

  • 在運行完任何探測代碼后,必須立即更新 plan.md 文件。
  • 在記錄完成之前,絕對不允許開始下一步的探索。

Claude 采取了多種數學工具進行嘗試。它最初嘗試了簡單的線性與二次函數,但均未奏效。接著,它嘗試使用暴力深度優先搜索,最終因為搜索空間過大而放棄。隨后,它引入了「2D 蛇形分析」,并準確識別出該有向圖是一個帶有兩個生成元的凱萊圖(Cayley digraph)。

問題的突破發生在后半程的探索中:

  • 在第 15 次探索時,Claude 引入了「纖維分解」框架,將問題轉化為在坐標上選擇算子的排列組合。
  • 在第 25 次探索后,它自主得出結論,認為模擬退火算法雖然能找到解,卻無法給出通用構造,此時需要純粹的數學推導。
  • 最終在第 31 次探索時,Claude 注意到每個纖維的選擇僅依賴于單個坐標,并據此給出了一個具體的 Python 構造程序,成功得出了 m=3, 5, 7, 9, 11 的完美分解方案。



簡化版的 Python 程序,用 C 語言形式寫的

嚴謹的數學證明與偶數域的挑戰

得出構造代碼僅僅是第一步。Stappers 驗證了 3 到 101 之間所有奇數 m 的情況,均獲得了完美的分解方案。隨后,高德納接手進行了嚴謹的數學證明。他詳細推導了生成的第一個環包含所有具備相同特征的 m2 個頂點,從而證實其長度確為 m3,是一個真正的哈密頓環。

高德納進一步研究發現,在所有類似 Claude 生成邏輯的分解法中,恰好有 760 種對所有奇數 m>1 均有效的解。Claude 憑借自身推導準確找到了其中的一種。

目前,偶數 m 的情況依然懸而未決。

  • Claude 在探索中曾找到 m=4, 6, 8 的解,但未能發現其中的通用規律。
  • 當被要求繼續攻克偶數情況時,Claude 陷入了困境,后續甚至無法正確編寫探索程序。
  • 另一位研究者 Ho Boon Suan 借助 gpt-5.3-codex 生成了處理大于 8 的偶數 m 的代碼,并在高達 m=2000 的規模下測試成功。
  • 但由于其模式過于復雜,目前人工證明其正確性的難度極大。

在 Hacker News 和 Reddit 等技術社區中,開發者們普遍認為這次事件的核心意義在于,AI 在數學輔助證明中展現出了自主更換探索工具、排查無效路徑的能力。

正如高德納在文末所感嘆的那樣,克勞德?香農(Claude Shannon)在天之靈若能知曉他的名字與此類進步聯系在一起,定會感到驕傲。

Hats off to Claude!

AI 進軍數學殿堂:從競賽奪金到前沿探索

高德納的驚嘆并非孤例。事實上,在過去的一年多時間里, AI 在解決復雜數學和邏輯問題上已經取得了多個具有實質性意義的突破。

  • 國際奧數突破:2025 年 7 月,Google DeepMind 發布的 Gemini(Deep Think 模式)在 IMO 試題評測中達到金牌標準成績,取得 35 分,并能在接近正式考試條件下輸出完整自然語言證明。與此同時,OpenAI 也披露其內部模型達到了類似水平,但官方認證與評測細節相對有限。
  • 編程競賽能力躍升:2025 年 9 月,OpenAI 和 Gemini 都聲稱達到了 ICPC 金牌水平,能夠在嚴格時間限制內解決高難度算法問題。不過,這些成績主要來自平行測試或基準評估,并非以正式參賽身份在 International Collegiate Programming Contest 中獲得官方金牌。
  • 從解題到科研協作:如今,AI 在科研中的角色顯著增強。模型開始借助外部工具參與數學研究與問題驗證,在復雜猜想與定理探索中發揮輔助作用。例如, GPT-5.2 借助外部工具,協助數學家解決了數個懸而未決的 Erd?s 猜想,并得到了著名數學家陶哲軒的驗證。部分系統已展示出生成研究草稿與進行結構化推理的能力。

驅動這些突破的核心機制也發生了改變。 AI 開始減少對單次快速生成的依賴。現在的模型普遍采用「測試時計算擴展」或「慢思考」策略。通過在推理階段投入更多算力,模型能夠并行探索多條解題路徑并進行嚴格的自我驗證。

展望未來, AI 與數學的結合將突破封閉環境下的標準化考題。隨著自然語言理解力與形式化邏輯的深度融合,AI 將成為數學家與工程師身邊得力的合作者,幫助人類共同攻克那些停滯多年的科學難題。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
小學生“倒數第一”試卷又火了,老師:這孩子智商太高,我教不了

小學生“倒數第一”試卷又火了,老師:這孩子智商太高,我教不了

浩源的媽媽
2026-01-27 06:29:07
辦事大廳收材料的人,半年都能收1600多萬 省委書記怒了:“吃拿卡要、損害企業利益的,遲早都會被查處”

辦事大廳收材料的人,半年都能收1600多萬 省委書記怒了:“吃拿卡要、損害企業利益的,遲早都會被查處”

大風新聞
2026-03-06 16:46:09
寫入教科書的一天:F-35在德黑蘭完成全球首次實戰空對空擊殺

寫入教科書的一天:F-35在德黑蘭完成全球首次實戰空對空擊殺

斌聞天下
2026-03-06 07:30:03
伊朗官員:美國媒體在撒謊!伊朗沒有向美國發送任何信息

伊朗官員:美國媒體在撒謊!伊朗沒有向美國發送任何信息

西游日記
2026-03-05 14:03:18
伊朗越打越猛,特朗普騎虎難下!美國實際上已經輸了

伊朗越打越猛,特朗普騎虎難下!美國實際上已經輸了

哲叔視野
2026-03-06 09:26:23
特朗普:“澤連斯基是與俄達成協議的障礙”

特朗普:“澤連斯基是與俄達成協議的障礙”

參考消息
2026-03-06 15:16:04
國家發改委主任:新建、改擴建1000所普通高中,增加學位200萬個以上,支持雙一流高校本科擴招10萬人以上

國家發改委主任:新建、改擴建1000所普通高中,增加學位200萬個以上,支持雙一流高校本科擴招10萬人以上

極目新聞
2026-03-06 18:28:25
暴漲819%后買在山頂,滿倉硬扛竟虧近5萬

暴漲819%后買在山頂,滿倉硬扛竟虧近5萬

財經智多星
2026-03-05 12:18:48
美以開打一周欲拖盟友“下水” 伊朗再襲美“林肯”號航母

美以開打一周欲拖盟友“下水” 伊朗再襲美“林肯”號航母

大象新聞
2026-03-06 07:27:19
連民生用水都不能吐槽了嗎?到底是誰在害怕?不去解決問題,解決提問題的?

連民生用水都不能吐槽了嗎?到底是誰在害怕?不去解決問題,解決提問題的?

鹽城市民網
2026-03-06 11:25:34
鵝廠門口爆滿了!騰訊工程師在總部樓下免費安裝OpenClaw

鵝廠門口爆滿了!騰訊工程師在總部樓下免費安裝OpenClaw

快科技
2026-03-06 15:16:08
巴林美軍官住宅被定點清除,80枚集束炸彈空襲特拉維夫!

巴林美軍官住宅被定點清除,80枚集束炸彈空襲特拉維夫!

勝研集
2026-03-06 15:09:57
何潔“六位數賬單”驚醒80后:別讓“中年危機”成為“財務危機”

何潔“六位數賬單”驚醒80后:別讓“中年危機”成為“財務危機”

徐sir財經
2026-03-06 09:28:26
這杯玫瑰咖啡,喝的是“供應鏈真實力”

這杯玫瑰咖啡,喝的是“供應鏈真實力”

正解局
2026-03-06 16:26:05
伊朗集裝箱船改造的航母被擊沉? 伊軍指揮官:這幾天只是清庫存,會亮從未公開的大殺器

伊朗集裝箱船改造的航母被擊沉? 伊軍指揮官:這幾天只是清庫存,會亮從未公開的大殺器

紅星新聞
2026-03-06 14:00:17
張一鳴成為中國首富

張一鳴成為中國首富

江西工人報
2026-03-05 20:32:13
太突然!上海人熟悉的“老舅媽”嫩娘因病去世

太突然!上海人熟悉的“老舅媽”嫩娘因病去世

上觀新聞
2026-03-06 12:37:06
伊朗學校葬禮上的這個中國書包,令人心碎

伊朗學校葬禮上的這個中國書包,令人心碎

補壹刀
2026-03-05 00:24:07
官宣!5月1日起煙花燃放全面新規,普通人買、放、存全變了

官宣!5月1日起煙花燃放全面新規,普通人買、放、存全變了

老特有話說
2026-03-06 16:14:54
世界現役最大軍艦,確認被擊毀!

世界現役最大軍艦,確認被擊毀!

航空知識
2026-03-04 19:09:03
2026-03-06 19:32:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12428文章數 142578關注度
往期回顧 全部

科技要聞

獨家|除夕加班、毫無黑料!林俊旸無奈離場

頭條要聞

中東戰火重燃之際 金正恩時隔半年再度登上"最大的船"

頭條要聞

中東戰火重燃之際 金正恩時隔半年再度登上"最大的船"

體育要聞

跑了24年,他終于成為英超“最長的河”

娛樂要聞

周杰倫社交媒體曬昆凌,夫妻感情穩定

財經要聞

關于經濟、股市等,五部門都說了啥?

汽車要聞

逃離ICU,上汽通用“止血”企穩

態度原創

時尚
家居
游戲
本地
公開課

看來看去還是這些穿搭最高級,不老套、不死板,舒適又顯氣質

家居要聞

暖棕撞色 輕法奶油風

《殺戮尖塔2》破肉鴿紀錄!28萬爬塔人集體開干

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版