337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

陶哲軒驚呼“變天”,AI用6小時改寫數學史

0
分享至

一塊閃亮的數學獎牌,剛剛被寫入代碼的智能體在6小時內摘下,而人類為此思考了30年。

PART 01

AI六小時破解30年數學難題

2025年12月,人工智能領域迎來里程碑事件:Harmonic公司開發的AI系統“亞里士多德”僅用6小時便攻克了困擾數學界30年的埃爾德什問題#124簡化版。這一突破被學界稱為“數學智能體時代的開端”,而菲爾茲獎得主陶哲軒則犀利指出:AI正在高效收割數學界的“低垂果實”,讓人類研究者得以聚焦更具挑戰性的核心問題。



埃爾德什問題#124自1995年提出以來,一直是組合數論領域的頑固堡壘。其核心命題探討:給定k個不小于2的自然數d?,若∑1/(d?-1) ≥ 1,是否所有足夠大的自然數n都能表示為特定0-1組合的和?這個看似簡潔的問題,卻讓數學家們在最大公約數(gcd)約束和邊界案例驗證中陷入長達三十年的僵局。

“亞里士多德”的突破性在于其完全獨立的證明能力。它采用創新的“vibe proving”方法論,融合強化學習與蒙特卡洛樹搜索,在無需人類干預的情況下遍歷上億種證明路徑,最終輸出100%可驗證的定理。整個過程僅耗時6小時,而通過Lean形式化驗證系統的檢驗只需1分鐘。



耐人尋味的是,當通用AI巨頭ChatGPT和Gemini面對同一問題時,卻集體“折戟”。陶哲軒分析指出:Gemini僅能給出排除數字1后gcd條件成為必要的基礎觀察;ChatGPT則表現出明顯的“路徑依賴”,大量引用已有網頁和論文,未能提出原創性觀點。

這種差異揭示了專業AI與通用AI的本質分野——當“亞里士多德”被設計為“邏輯工匠”,基于形式邏輯生成可驗證代碼時,ChatGPT類模型仍是“猜詞機器”,依賴統計概率生成文本。

PART 02

“人機協同”的科研革命

陶哲軒將數學未解問題的分布描述為“長尾特征”。大多數難題并非超高難度,而是因人類數學家資源有限而被擱置的“低垂果實”。AI的自動化能力恰恰擅長處理這類問題。



在埃爾德什問題網站上,“未解”標簽最近減少了近十個,這并非因為人類突然解決了這些問題,而是AI通過文獻檢索發現它們早已被攻克。這種現象揭示了AI作為“清道夫”的價值——它能清理最容易解決的問題,讓人類聚焦于真正具有挑戰性的核心難題。

HarmonicMath創始人Vlad Tenev提出的“Vibe證明時代”已經到來。這一概念意味著AI不僅能輔助驗證,還能獨立創造。在數學領域,這種變革尤為深刻,因為數學的形式化特性使其非常適合AI參與。



微軟前AI副總裁Sebastien Bubeck激動地分享道:“該解決方案100%由AI生成,總計耗時6小時。”這一效率與人類數學家30年的掙扎形成鮮明對比,凸顯了AI在科研效率方面的革命性提升。

PART 03

AI當前局限與信息學學生的不可替代性

盡管“亞里士多德”取得了突破,但它解決的是原問題的簡化版本。原版埃爾德什問題#124不允許使用數字1且需要滿足額外的最小公約數條件,這一更復雜的版本仍有待解決。

AI在數學推理中面臨的主要挑戰之一是“超長推理鏈”問題。高中數學證明可能只需10到40步,而像黎曼猜想這樣的難題,證明路徑可能長達百萬步。美國加州理工學院的謝爾蓋·古科夫指出,這類超長路徑極難處理,AI必須在指數級增長的可能路徑中找到正確解法。



DeepMind的AlphaProof和AlphaGeometry2在國際奧數競賽中表現出色,但專家們普遍認為,它們仍缺乏真正的數學洞察力。競賽題有一定“套路”,而真正的數學研究更開放、復雜。初創公司Epoch AI的FrontierMath測試顯示,面對全新技術難題,LLM幾乎集體“交白卷”。

數學家董彬指出,AI在數學研究中的理想角色是“AI學徒”——用訓練數學家的方式培養AI助手。但目前,AI更適用于“單點突破”,從局部解決某些具體問題,而非全面替代人類直覺和創造力。

PART 04

信息學學生的四維能力重構

當AI開始收割數學“低垂果實”,信息學學生亟需重構能力模型,在以下四個維度建立新優勢:

人機協同的架構思維——“亞里士多德”的成功源于其專業定位——與通用大模型不同,它專為數學證明設計,融合強化學習、蒙特卡洛樹搜索與Lean形式化語言。這種“領域專用智能”架構思維值得信息學學生深入學習。正如DeepSeek-V3.2-Speciale模型展現的,通過融合定理證明能力,專業模型在IMO、ICPC等賽事中已超越多數人類選手。

形式化驗證的必備技能——Lean證明系統的應用標志著數學驗證進入程序化時代。信息學學生需掌握形式化驗證工具,將自然語言證明轉化為機器可驗證代碼。這不僅是防范AI幻覺的有效手段,更是未來科研協作的基礎能力。埃爾德什#124的證明在GitHub公開后,全球研究者均可參與驗證與拓展(github.com/plby/lean-proofs)。

直覺引導的算法設計——當前AI在依賴性質觀察與解題直覺的題目上仍存在明顯局限。如AlphaProof解決3個IMO問題耗時3天,而人類選手僅需4.5小時。信息學學生應強化元認知能力,在AI陷入局部最優時提供方向性指導,這正是人類思維不可替代的核心價值——正如PatternBoost AI系統開發者所言:“探索性思維是數學的核心”。

問題發現的戰略眼光——倫敦數學科學研究所何楊輝指出:AI能幫助證明問題,卻無法幫助確定需要解決的關鍵問題。信息學學生需培養科學發現的前瞻力,在AI清理“低垂果實”后,精準識別真正值得攻堅的“數學高峰”。這種能力建立在對學科發展脈絡的深刻理解與跨領域知識融合基礎上。

PART 05

教育轉型:從工具使用者到智能體架構師

面對AI的沖擊,信息學教育正在經歷范式轉變。2025年CNCC論壇達成共識:信息學奧賽應繼續堅持以計算思維培養為核心,同時更加重視學生發現問題和提出問題的能力。微軟前AI副總裁塞巴斯蒂安·布貝克激動地分享AI攻克埃爾德什難題的消息時,強調“解決方案100%由AI生成”。



但走進普林斯頓高等研究院,數學家們已在全新實驗室工作:人類提出大膽猜想,AI負責驗證與反例生成;人類構建理論框架,AI完成繁瑣計算;人類捕捉靈感火花,AI將其轉化為嚴謹證明。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
繞過霍爾木茲!海灣國家“不惜下血本”:考慮修建新輸油管道

繞過霍爾木茲!海灣國家“不惜下血本”:考慮修建新輸油管道

財聯社
2026-04-02 14:48:21
無論你領多高的退休金,只要孩子沒穩定的工作,晚年就不會太好過

無論你領多高的退休金,只要孩子沒穩定的工作,晚年就不會太好過

小馬達情感故事
2026-04-01 18:10:03
4月2日人民幣對美元中間價調升145個基點

4月2日人民幣對美元中間價調升145個基點

證券時報
2026-04-02 09:42:02
張本智和驚魂大逆轉!2-0領先遭翻盤,7局鏖戰太窒息

張本智和驚魂大逆轉!2-0領先遭翻盤,7局鏖戰太窒息

林子說事
2026-04-02 15:09:46
1979年,有人提議保留汪東興職務,陳云:讓他當領導,沒人會答應

1979年,有人提議保留汪東興職務,陳云:讓他當領導,沒人會答應

歷史點行
2026-04-03 00:57:27
驚問:很多80后失業,他們的未來又在哪里…

驚問:很多80后失業,他們的未來又在哪里…

慧翔百科
2026-04-02 15:27:33
比賴清德更狂的人出現了,如果她當臺灣地區領導人,我軍該怎么辦

比賴清德更狂的人出現了,如果她當臺灣地區領導人,我軍該怎么辦

聽風喃
2026-03-27 17:40:05
以色列命門曝光!唯一污水廠覆蓋250萬人,90%污水處理停擺即癱瘓

以色列命門曝光!唯一污水廠覆蓋250萬人,90%污水處理停擺即癱瘓

金哥說新能源車
2026-04-02 14:03:33
以色列突然與法國決裂,停購所有法國武器!雙方存在哪些矛盾?

以色列突然與法國決裂,停購所有法國武器!雙方存在哪些矛盾?

瀲滟晴方DAY
2026-04-03 01:23:53
環球影城一過山車叕發故障!32人被倒掛高空!近10年至少5起故障

環球影城一過山車叕發故障!32人被倒掛高空!近10年至少5起故障

特種設備安全科普
2026-04-02 11:03:02
房價要變天了?若不出意外的話,2026年二手房價格將迎來4大轉變

房價要變天了?若不出意外的話,2026年二手房價格將迎來4大轉變

說故事的阿襲
2026-04-02 17:28:29
亞馬遜把Colorsoft壓到169刀,墨水屏玩家集體破防

亞馬遜把Colorsoft壓到169刀,墨水屏玩家集體破防

摸魚算法
2026-03-31 09:07:01
別在那酸“大胸脯漂白”,有這功夫不如好好欣賞

別在那酸“大胸脯漂白”,有這功夫不如好好欣賞

飛娛日記
2026-04-02 09:13:08
繞月飛行中廁所罷工:NASA宇航員遭遇尿液收集系統失靈

繞月飛行中廁所罷工:NASA宇航員遭遇尿液收集系統失靈

快科技
2026-04-02 16:26:18
他接受紀律審查和監察調查

他接受紀律審查和監察調查

錫望
2026-04-02 10:10:34
男子同意砸破車窗取AED救人,婉拒對方2000元酬謝:設備已放置兩年,本不希望用到

男子同意砸破車窗取AED救人,婉拒對方2000元酬謝:設備已放置兩年,本不希望用到

環球網資訊
2026-04-02 17:30:24
網友吐槽男乒抽簽:16強有7人贏過王楚欽,6人在另一半區

網友吐槽男乒抽簽:16強有7人贏過王楚欽,6人在另一半區

懂球帝
2026-04-02 13:25:06
王祖賢獻花悼念張國榮,坐紀念長椅凝視舊照,一待就是大半天

王祖賢獻花悼念張國榮,坐紀念長椅凝視舊照,一待就是大半天

觀察鑒娛
2026-04-02 10:36:48
張雪峰辦公室 “詭異” 一角引熱議!黑白照 + 香爐 網友:不吉利

張雪峰辦公室 “詭異” 一角引熱議!黑白照 + 香爐 網友:不吉利

魔都姐姐雜談
2026-03-30 19:57:02
涉嫌嚴重違紀違法,趙江平被查

涉嫌嚴重違紀違法,趙江平被查

吉刻新聞
2026-04-02 19:57:53
2026-04-03 04:07:00
電腦報少年派 incentive-icons
電腦報少年派
最新鮮的互聯網產業資訊
3918文章數 1603關注度
往期回顧 全部

科技要聞

三年虧20億,最新估值58億,Xreal沖刺港股

頭條要聞

北京89歲奶奶困屋內從27層翻窗下爬 爬到21層嚇壞鄰居

頭條要聞

北京89歲奶奶困屋內從27層翻窗下爬 爬到21層嚇壞鄰居

體育要聞

邵佳一的改革,從讓每個人踢舒服開始

娛樂要聞

《浪姐》人氣榜出爐!曾沛慈斷層第一

財經要聞

市場被特朗普一句話打醒 滯脹交易回歸

汽車要聞

軸距2米7/后排能蹺腿 試駕后驅小車QQ3 EV

態度原創

家居
教育
親子
旅游
數碼

家居要聞

歲月靜好 典雅新章

教育要聞

王炸!這個區超兩成考生“搖號上高中”,北京中招格局悄然變臉?

親子要聞

這個廣告小時候抱過我

旅游要聞

文明旅游 | 清明出行,讓文明與安全一路相伴!

數碼要聞

跨界者大疆:不折騰才是掃地機的終極形態

無障礙瀏覽 進入關懷版