337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

太瘋了!MIT博士在Transformer里造計算機,攻破LLM終極缺陷

0
分享至


新智元報道

編輯:KingHZ Aeneas

【新智元導讀】炸裂!就在剛剛,一位MIT博士,在Transformer里造出個計算機。現在,模型一舉洗刷「9.11與9.9哪個大」的恥辱,幾秒內運行數百萬步程序,世界最難數獨準確率100%!大模型的能力邊界,從此徹底改變。

就在剛剛,AI圈被一項暴力美學般的突破,徹底震碎了三觀。

一位MIT博士,在Transformer里,直接造出了個計算機!

注意,不是外掛插件,不是調用工具(Tool Use),而是通過一種近乎瘋狂的硬編碼方式,將一個WebAssembly (WASM) 解釋器無損地(Losslessly)嵌入到了Transformer模型的權重之中。


這位博士老哥,是真的把LLM玩出硬件感了

這意味著,從此LLM不再是靠概率預測下一個智元(Token)的文字游戲機,而是進化成了一臺真正的數字計算機。

如果你以為,LLM現在還算不清「9.11與9.9哪個大」,現在,你的認知將被徹底粉碎!

現在,這篇帖子已經在X上熱轉,引來眾多開發者大神的瘋狂點贊。

可以說,它一舉洗刷了大模型3年以來的「恥辱」。

「Vibe Coding」之父、大神Karpathy直接驚呼:這項研究太棒了,實在是令人深受啟發!


LLM終極弱點,被徹底攻破

作為一種新類型的智能,大模型能解研究級難題,但不借助外部工具,卻幾乎不可能完成兩個數相乘或解個小數獨。

那么,如何讓LLM本身變得像計算機一樣可靠高效?

答案是:在Transformer內部實實在在地構建一臺計算機。

雅典大學副教授、MIT博士Christos Tzamos及其Percepta團隊將任意C代碼轉化為智元(Token),讓模型自己能可靠執行,在幾秒內運行數百萬步。


鏈接:https://www.percepta.ai/blog/can-llms-be-computers

通過匈牙利算法,它解決了一個多步優化問題,即求解最小成本完美匹配,運作方式如下。


在這個過程中,AI并不調用外部工具。

所有計算都是在Transformer內部以自回歸的方式完成的!

這里的難點在于,對于任何實際計算來說,LLM的標準注意力機制太慢了。

為了繞過這一限制,他們發明了一種新的解碼路徑,實現了指數級加速的注意力機制,讓每智元(Token)生成所需的幾乎所有計算量智元(Token),并在CPU上以超過每秒3萬個智元(Token)的速度流式輸出結果。



要知道MacBook M2 Pro的解碼速度才每秒27個智元(token),每秒33000個智元(Token)堪稱火箭般的速度,讓人難以想象!


當然,用LLM的計算速度無法與CPU相比,這項研究的關鍵意義在于賦予LLM內在計算能力,真正教會AI算數,讓它更聰明。


而這項能力與自動研究相結合,未來探索空間更是遠超想象。


網友贊嘆:這才是真正的原生智能!


傳統attention

可以退出歷史舞臺?

注意,這項工作,并不是讓模型更會算,而是讓模型在內部真正執行程序!

不靠外掛,不調用Python,所有計算,都發生在Transformer里。

更離譜的是,這臺「計算機」幾秒就能跑完百萬步的程序。連做最難的數獨,正確率都是100%。


在3分鐘內,它就實現了100%的精確求解

這種方法不僅可用于速度,它可以用于執行任意代碼——就像在AI腦子中塞入了一臺電腦。


按照大V「Rainier」的說法,這個思路有點類似于TI的dsp芯片:ARM負責邏輯思維,dsp專門負責高速數據計算,各取所長。


這也意味著,一種Hybrid LLM架構的全新范式開始出現,其中神經網絡負責推理和理解,嵌入式解釋器/計算引擎負責高精度計算。

于是可以同時兼顧推理能力和確定性計算精度,徹底解決「9.11和9.9哪個大」這個問題。

這個方向走通的話,數值計算、物理模擬、金融建模、密碼學運算,都會發生極大變革。

傳統Attention太慢,根本不適合做計算,而這項研究,直接引爆了Transformer的范式躍遷!


AI最大的恥辱,如今被終結了

三年了。


三年來,每個頂級AI經歷過同一個社死時刻:當你在臺上信心滿滿地演示大模型的超強推理能力,臺下忽然有人舉手提問:「那請問,9.11和9.9哪個大?」

模型回答「9.11 > 9.9」,全場哄堂大笑。

這不是段子,這是真實發生過無數次的事。


2024年,在記者Matt Barnum測試中,基于ChatGPT的學習輔導工具Khanmigo,有時連算術題的答案都拿不準

原因不難理解:Transformer本為理解語言設計的,并非為精確計算設計。

讓大模型做算術,就像讓莎士比亞做會計——他能把財報寫成十四行詩,但數字八成對不上。

AI行業的補丁方案是「外掛工具」:算不了?那就調Python。


這相當于給莎士比亞旁邊放了個計算器。雖然能用,但并不優雅,而且每次調用都打斷推理鏈、增加延遲、引入安全風險。

現在,MIT博士說:別給莎士比亞放計算器了直接讓他天生就會算數

他們把一臺完整的WebAssembly虛擬機,硬編碼進了Transformer的權重里。

也就是說,神經網絡的前向傳播過程本身,就等價于執行一臺計算機。

過去AI的恥辱,如今終結了。

不過,但就數獨問題而言,這不是LLM第一次突破。

工程師Aviraj認為Percepta的方法很酷,但他們采取了不同的、更面向具體問題的路徑。

核心區別在于:不將通用編譯產物(如C->WASM)作為模型的學習目標,而是為特定任務設計一個極簡的、領域專用的指令集(PSVM)。



不過,這次看看Christos Tzamos團隊如何在Transformer內部跑起來一臺電腦的。

這個過程的關鍵,就是找到一種方法,來編碼一臺可工作的計算機。

計算:一條只增不減的軌跡

要理解Transformer如何在內部執行程序,不妨用一種稍微不同的方式來思考計算。

想象一個筆記本,計算的每一步都寫在下一行。一旦寫下,前面的行就不能更改;筆記本只會越來越厚。

這驚人地接近自回歸Transformer的工作方式:提示詞是輸入,生成的智元形成不斷增長的軌跡,每個新智元都是通過注意力機制回看少量位置后產生的。

比如,給定一個句子,統計其中動詞的數量是奇數還是偶數。每個軌跡智元恰好關注兩個位置:對應的輸入詞(檢查它是否是動詞)和前一個軌跡智元(讀取當前的奇偶狀態)。


請注意,無論句子有多長,每一步都只需要兩次回看(一次看提示詞,一次看軌跡)。

這正是其中的核心洞察:許多算法都可以表示成這種只增不減的軌跡,每一步只需讀取少量、固定數量的先前位置。

那么,計算能否被表示成一條只增不減的軌跡,且每一步只需回看少量次數呢?

答案是肯定的。

在Christos Tzamos的系統中,AI模型明確地生成了這樣的軌跡。

它生成的智元代表了一個虛擬機的動態狀態:指令指針、內存和棧操作、算術運算、控制流以及輸出。

AI只需通過回看相關的先前步驟,就能重構出當前狀態。

這幾乎就是圖靈機!


圖靈機是一種抽象的計算機模型,它通過在一個無限長的紙帶上進行讀寫操作來執行計算。

但即使Transformer能表示這種執行軌跡,隨著軌跡變長,標準的解碼過程仍然會付出越來越高的成本。

然而,Christos Tzamos等提出了快速解碼路徑,消除了這一障礙,而二維注意力頭限制,正是實現這一快速路徑的關鍵。


總的來說,這件事真正有價值的地方,不在于「模型更會算了」,而有些能力,可以直接以「系統」的形式嵌入進去。

當Transformer內部開始運行真正的程序,LLM就不再只是一個概率模型,而更像一個由推理系統和計算引擎組成的混合體。

AI,正在變成一整套可以執行、可以組合、可以擴展的系統。

這,可能就是下一代AI的真正方向。

參考資料:

https://x.com/mtrainier2020/status/2033640996337291482

https://www.percepta.ai/blog/can-llms-be-computers

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
52分慘案!東部黑馬31-0超級攻勢:全場狂歡慶祝,巴恩斯送15助

52分慘案!東部黑馬31-0超級攻勢:全場狂歡慶祝,巴恩斯送15助

體壇小李
2026-03-30 09:37:18
44天!熱刺8億豪陣瀕臨降級,管理層“豪賭”失敗,幕后真兇是誰

44天!熱刺8億豪陣瀕臨降級,管理層“豪賭”失敗,幕后真兇是誰

落夜足球
2026-03-30 10:56:47
媒體人:現在的上海隊有點可怕,在現階段上海最有冠軍相

媒體人:現在的上海隊有點可怕,在現階段上海最有冠軍相

林子說事
2026-03-30 06:06:14
日經225指數跌幅擴大至5%,現報50695.72點

日經225指數跌幅擴大至5%,現報50695.72點

每日經濟新聞
2026-03-30 08:21:04
1090投1000中!命中率高達92%!利拉德太狠了,楊瀚森趕緊練吧

1090投1000中!命中率高達92%!利拉德太狠了,楊瀚森趕緊練吧

世界體育圈
2026-03-29 18:48:32
突然集體拉升!霍爾木茲海峽,大消息!以軍參謀長說以軍常規部隊已崩潰

突然集體拉升!霍爾木茲海峽,大消息!以軍參謀長說以軍常規部隊已崩潰

證券時報e公司
2026-03-28 22:22:58
李鑫同事曝他在養家真實情況,沒有豪宅 出行騎電動車,崗位很辛苦

李鑫同事曝他在養家真實情況,沒有豪宅 出行騎電動車,崗位很辛苦

奇葩游戲醬
2026-03-30 00:16:09
活久見!奶奶從集市買回小雞,要先用火烤一烤,網友怒斥“兇狠”

活久見!奶奶從集市買回小雞,要先用火烤一烤,網友怒斥“兇狠”

火山詩話
2026-03-29 07:05:31
41歲女子被羈押821天被判無罪,獲賠13天后被叫停!當事人回應昌江通報:堅信法律

41歲女子被羈押821天被判無罪,獲賠13天后被叫停!當事人回應昌江通報:堅信法律

大象新聞
2026-03-29 17:45:20
FF超額完成機器人首個交付月出貨目標

FF超額完成機器人首個交付月出貨目標

首席商業觀察
2026-03-30 11:02:14
江浙滬人對青菜的執念火了!網友:我們這兒,只認這一種叫青菜?

江浙滬人對青菜的執念火了!網友:我們這兒,只認這一種叫青菜?

房產衫哥
2026-03-29 08:33:50
2025北京屬醫院收入:緊日子來了

2025北京屬醫院收入:緊日子來了

觀星賞月
2026-03-29 18:44:54
克雷桑聚餐遭質疑!京媒:職業球員能喝這個?澤卡、馬德魯加在列

克雷桑聚餐遭質疑!京媒:職業球員能喝這個?澤卡、馬德魯加在列

建哥說體育
2026-03-29 18:58:38
越南工廠搶人白熱化!外企砸重金,富士康也下場搶工人了

越南工廠搶人白熱化!外企砸重金,富士康也下場搶工人了

生活新鮮市
2026-03-30 10:47:14
落難的鳳凰不如雞,多位明星無戲可拍,淪落到給景區打工,太心酸

落難的鳳凰不如雞,多位明星無戲可拍,淪落到給景區打工,太心酸

秋姐居
2026-03-29 22:00:48
俄烏戰爭形勢要完全改變了,今年烏可能要把前線三分之一步兵換下

俄烏戰爭形勢要完全改變了,今年烏可能要把前線三分之一步兵換下

阿七說史
2026-03-25 15:33:19
當年排隊買不到,如今降價沒人理!“電驢界愛馬仕”倒在自家高墻

當年排隊買不到,如今降價沒人理!“電驢界愛馬仕”倒在自家高墻

小舟談歷史
2026-03-29 15:30:08
注意:家里這8樣東西是“玻璃纖維品”,一旦壞了趕緊扔掉!

注意:家里這8樣東西是“玻璃纖維品”,一旦壞了趕緊扔掉!

摳搜俠
2026-03-29 14:10:03
遺傳病能有多恐怖?網友:癌癥遺傳那個堪稱地獄級了

遺傳病能有多恐怖?網友:癌癥遺傳那個堪稱地獄級了

帶你感受人間冷暖
2026-03-28 16:23:17
決不輕饒!軍工反腐揪出大老虎,不是技不如人,而是“蛀蟲”太多

決不輕饒!軍工反腐揪出大老虎,不是技不如人,而是“蛀蟲”太多

無悔的燦爛人生
2026-03-28 20:46:25
2026-03-30 12:03:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
14847文章數 66724關注度
往期回顧 全部

科技要聞

DeepSeek性能異常問題已解決,服務恢復

頭條要聞

伊朗警告:美以軍政人員住所將成為合法打擊目標

頭條要聞

伊朗警告:美以軍政人員住所將成為合法打擊目標

體育要聞

絕殺衛冕冠軍后,他單手指天把勝利獻給父親

娛樂要聞

單依純凌晨發長文道歉!李榮浩再回應

財經要聞

油價沖擊,有些亞洲貨幣先扛不住了!

汽車要聞

理想i9要來了!外形似小號MEGA 能沖擊高端純電市場?

態度原創

藝術
本地
游戲
房產
軍事航空

藝術要聞

600 年前的「產亡孤魂」,藏著中國女性最痛的記憶

本地新聞

在濰坊待了三天,沒遇到一個“濰坊人”

“政治正確”大作獲M站84分全好評!媒體狂贊劇情

房產要聞

搶!海口剛又掛出好地,樓面價低到5000+/㎡!

軍事要聞

美兩棲攻擊艦載3500名增援到達

無障礙瀏覽 進入關懷版