337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

太瘋了!MIT博士在Transformer里造計算機,攻破LLM終極缺陷

0
分享至


新智元報道

編輯:KingHZ Aeneas

【新智元導讀】炸裂!就在剛剛,一位MIT博士,在Transformer里造出個計算機。現在,模型一舉洗刷「9.11與9.9哪個大」的恥辱,幾秒內運行數百萬步程序,世界最難數獨準確率100%!大模型的能力邊界,從此徹底改變。

就在剛剛,AI圈被一項暴力美學般的突破,徹底震碎了三觀。

一位MIT博士,在Transformer里,直接造出了個計算機!

注意,不是外掛插件,不是調用工具(Tool Use),而是通過一種近乎瘋狂的硬編碼方式,將一個WebAssembly (WASM) 解釋器無損地(Losslessly)嵌入到了Transformer模型的權重之中。


這位博士老哥,是真的把LLM玩出硬件感了

這意味著,從此LLM不再是靠概率預測下一個智元(Token)的文字游戲機,而是進化成了一臺真正的數字計算機。

如果你以為,LLM現在還算不清「9.11與9.9哪個大」,現在,你的認知將被徹底粉碎!

現在,這篇帖子已經在X上熱轉,引來眾多開發者大神的瘋狂點贊。

可以說,它一舉洗刷了大模型3年以來的「恥辱」。

「Vibe Coding」之父、大神Karpathy直接驚呼:這項研究太棒了,實在是令人深受啟發!


LLM終極弱點,被徹底攻破

作為一種新類型的智能,大模型能解研究級難題,但不借助外部工具,卻幾乎不可能完成兩個數相乘或解個小數獨。

那么,如何讓LLM本身變得像計算機一樣可靠高效?

答案是:在Transformer內部實實在在地構建一臺計算機。

雅典大學副教授、MIT博士Christos Tzamos及其Percepta團隊將任意C代碼轉化為智元(Token),讓模型自己能可靠執行,在幾秒內運行數百萬步。


鏈接:https://www.percepta.ai/blog/can-llms-be-computers

通過匈牙利算法,它解決了一個多步優化問題,即求解最小成本完美匹配,運作方式如下。


在這個過程中,AI并不調用外部工具。

所有計算都是在Transformer內部以自回歸的方式完成的!

這里的難點在于,對于任何實際計算來說,LLM的標準注意力機制太慢了。

為了繞過這一限制,他們發明了一種新的解碼路徑,實現了指數級加速的注意力機制,讓每智元(Token)生成所需的幾乎所有計算量智元(Token),并在CPU上以超過每秒3萬個智元(Token)的速度流式輸出結果。



要知道MacBook M2 Pro的解碼速度才每秒27個智元(token),每秒33000個智元(Token)堪稱火箭般的速度,讓人難以想象!


當然,用LLM的計算速度無法與CPU相比,這項研究的關鍵意義在于賦予LLM內在計算能力,真正教會AI算數,讓它更聰明。


而這項能力與自動研究相結合,未來探索空間更是遠超想象。


網友贊嘆:這才是真正的原生智能!


傳統attention

可以退出歷史舞臺?

注意,這項工作,并不是讓模型更會算,而是讓模型在內部真正執行程序!

不靠外掛,不調用Python,所有計算,都發生在Transformer里。

更離譜的是,這臺「計算機」幾秒就能跑完百萬步的程序。連做最難的數獨,正確率都是100%。


在3分鐘內,它就實現了100%的精確求解

這種方法不僅可用于速度,它可以用于執行任意代碼——就像在AI腦子中塞入了一臺電腦。


按照大V「Rainier」的說法,這個思路有點類似于TI的dsp芯片:ARM負責邏輯思維,dsp專門負責高速數據計算,各取所長。


這也意味著,一種Hybrid LLM架構的全新范式開始出現,其中神經網絡負責推理和理解,嵌入式解釋器/計算引擎負責高精度計算。

于是可以同時兼顧推理能力和確定性計算精度,徹底解決「9.11和9.9哪個大」這個問題。

這個方向走通的話,數值計算、物理模擬、金融建模、密碼學運算,都會發生極大變革。

傳統Attention太慢,根本不適合做計算,而這項研究,直接引爆了Transformer的范式躍遷!


AI最大的恥辱,如今被終結了

三年了。


三年來,每個頂級AI經歷過同一個社死時刻:當你在臺上信心滿滿地演示大模型的超強推理能力,臺下忽然有人舉手提問:「那請問,9.11和9.9哪個大?」

模型回答「9.11 > 9.9」,全場哄堂大笑。

這不是段子,這是真實發生過無數次的事。


2024年,在記者Matt Barnum測試中,基于ChatGPT的學習輔導工具Khanmigo,有時連算術題的答案都拿不準

原因不難理解:Transformer本為理解語言設計的,并非為精確計算設計。

讓大模型做算術,就像讓莎士比亞做會計——他能把財報寫成十四行詩,但數字八成對不上。

AI行業的補丁方案是「外掛工具」:算不了?那就調Python。


這相當于給莎士比亞旁邊放了個計算器。雖然能用,但并不優雅,而且每次調用都打斷推理鏈、增加延遲、引入安全風險。

現在,MIT博士說:別給莎士比亞放計算器了直接讓他天生就會算數

他們把一臺完整的WebAssembly虛擬機,硬編碼進了Transformer的權重里。

也就是說,神經網絡的前向傳播過程本身,就等價于執行一臺計算機。

過去AI的恥辱,如今終結了。

不過,但就數獨問題而言,這不是LLM第一次突破。

工程師Aviraj認為Percepta的方法很酷,但他們采取了不同的、更面向具體問題的路徑。

核心區別在于:不將通用編譯產物(如C->WASM)作為模型的學習目標,而是為特定任務設計一個極簡的、領域專用的指令集(PSVM)。



不過,這次看看Christos Tzamos團隊如何在Transformer內部跑起來一臺電腦的。

這個過程的關鍵,就是找到一種方法,來編碼一臺可工作的計算機。

計算:一條只增不減的軌跡

要理解Transformer如何在內部執行程序,不妨用一種稍微不同的方式來思考計算。

想象一個筆記本,計算的每一步都寫在下一行。一旦寫下,前面的行就不能更改;筆記本只會越來越厚。

這驚人地接近自回歸Transformer的工作方式:提示詞是輸入,生成的智元形成不斷增長的軌跡,每個新智元都是通過注意力機制回看少量位置后產生的。

比如,給定一個句子,統計其中動詞的數量是奇數還是偶數。每個軌跡智元恰好關注兩個位置:對應的輸入詞(檢查它是否是動詞)和前一個軌跡智元(讀取當前的奇偶狀態)。


請注意,無論句子有多長,每一步都只需要兩次回看(一次看提示詞,一次看軌跡)。

這正是其中的核心洞察:許多算法都可以表示成這種只增不減的軌跡,每一步只需讀取少量、固定數量的先前位置。

那么,計算能否被表示成一條只增不減的軌跡,且每一步只需回看少量次數呢?

答案是肯定的。

在Christos Tzamos的系統中,AI模型明確地生成了這樣的軌跡。

它生成的智元代表了一個虛擬機的動態狀態:指令指針、內存和棧操作、算術運算、控制流以及輸出。

AI只需通過回看相關的先前步驟,就能重構出當前狀態。

這幾乎就是圖靈機!


圖靈機是一種抽象的計算機模型,它通過在一個無限長的紙帶上進行讀寫操作來執行計算。

但即使Transformer能表示這種執行軌跡,隨著軌跡變長,標準的解碼過程仍然會付出越來越高的成本。

然而,Christos Tzamos等提出了快速解碼路徑,消除了這一障礙,而二維注意力頭限制,正是實現這一快速路徑的關鍵。


總的來說,這件事真正有價值的地方,不在于「模型更會算了」,而有些能力,可以直接以「系統」的形式嵌入進去。

當Transformer內部開始運行真正的程序,LLM就不再只是一個概率模型,而更像一個由推理系統和計算引擎組成的混合體。

AI,正在變成一整套可以執行、可以組合、可以擴展的系統。

這,可能就是下一代AI的真正方向。

參考資料:

https://x.com/mtrainier2020/status/2033640996337291482

https://www.percepta.ai/blog/can-llms-be-computers

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
因禍得福!燒129年的地下火被滅,新疆憑空多了個“金飯碗”

因禍得福!燒129年的地下火被滅,新疆憑空多了個“金飯碗”

夢在深巷aqa
2026-03-26 08:02:47
全球光纖告急!“一天一價”,缺口達30%!中國4大巨頭壟斷 60%!

全球光纖告急!“一天一價”,缺口達30%!中國4大巨頭壟斷 60%!

阿器談史
2026-03-27 00:22:26
做教培的閨蜜:張雪峰身價8億,為啥還吃外賣?她的回答讓我沉默

做教培的閨蜜:張雪峰身價8億,為啥還吃外賣?她的回答讓我沉默

藍色海邊
2026-03-27 18:08:02
悲催!房貸136萬,月供6580.36元,蘇州業主哭訴失業后奔深圳太難

悲催!房貸136萬,月供6580.36元,蘇州業主哭訴失業后奔深圳太難

火山詩話
2026-03-27 13:32:27
陪玩陪睡僅冰山一角,葛斯齊手撕夏克立,曬錄音扯掉完美父親面具

陪玩陪睡僅冰山一角,葛斯齊手撕夏克立,曬錄音扯掉完美父親面具

橙星文娛
2026-03-28 13:21:48
越扒越有!張雪峰去世早有預兆,他的3個不良愛好,或成催命符

越扒越有!張雪峰去世早有預兆,他的3個不良愛好,或成催命符

潮鹿逐夢
2026-03-26 11:24:44
小米的戰略級利空來了

小米的戰略級利空來了

阿爾法34號
2026-03-28 07:04:07
太尷尬!美軍高層攤牌:打伊朗沒問題,但打完就沒東西對付東大了

太尷尬!美軍高層攤牌:打伊朗沒問題,但打完就沒東西對付東大了

Hi科普啦
2026-03-27 14:43:13
突發!全球震動!A股下周要迎史詩級變天,這三大方向或要起飛?

突發!全球震動!A股下周要迎史詩級變天,這三大方向或要起飛?

股市皆大事
2026-03-28 11:46:30
武漢市委書記盛閱春,有新身份

武漢市委書記盛閱春,有新身份

新浪財經
2026-03-28 12:15:09
緬甸舉行閱兵儀式 紀念建軍81周年

緬甸舉行閱兵儀式 紀念建軍81周年

國際在線
2026-03-28 06:42:11
封鎖霍爾木茲海峽,伊朗丟掉的不只是底牌

封鎖霍爾木茲海峽,伊朗丟掉的不只是底牌

冰川思想庫
2026-03-26 00:05:12
楊穎咖位又降級了?新活動與韓安冉同框合影,生圖再美也難掩尷尬

楊穎咖位又降級了?新活動與韓安冉同框合影,生圖再美也難掩尷尬

阿傖說事
2026-03-28 15:39:17
一枚火箭彈灌頂轟炸,以色列總統緊急避難,伊朗的強援終于到了?

一枚火箭彈灌頂轟炸,以色列總統緊急避難,伊朗的強援終于到了?

空天力量
2026-03-28 13:09:48
萬科前董事長郁亮賣房退薪

萬科前董事長郁亮賣房退薪

地產微資訊
2026-03-28 09:11:38
霍啟山被曝和娜然婚期臨近,女方素顏生圖曝光狀態絕了

霍啟山被曝和娜然婚期臨近,女方素顏生圖曝光狀態絕了

橙星文娛
2026-03-28 11:42:28
蔣介石孫子召開發布會,提出“兩蔣”移靈大陸,2句話讓世人唏噓

蔣介石孫子召開發布會,提出“兩蔣”移靈大陸,2句話讓世人唏噓

老謝談史
2026-03-18 18:33:35
68歲大爺再婚15天就分手,55歲大媽:他不要臉,大爺:她才不要臉

68歲大爺再婚15天就分手,55歲大媽:他不要臉,大爺:她才不要臉

烙任情感
2026-03-27 14:53:44
巴基斯坦:將就中東局勢舉行四國外長會議

巴基斯坦:將就中東局勢舉行四國外長會議

財聯社
2026-03-28 09:33:05
社保基金持續加倉!這個板塊將誕生更多大牛股!

社保基金持續加倉!這個板塊將誕生更多大牛股!

證券市場周刊
2026-03-28 14:30:15
2026-03-28 16:51:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
14835文章數 66720關注度
往期回顧 全部

科技要聞

遭中國學界"拉黑"后,這家AI頂會低頭道歉

頭條要聞

月租7000元的"廢土風"房子火了 房東自稱花了10萬裝修

頭條要聞

月租7000元的"廢土風"房子火了 房東自稱花了10萬裝修

體育要聞

“我是全家最差勁的運動員”

娛樂要聞

王一博改名上熱搜!個人時代正式開啟!

財經要聞

我在小吃培訓機構學習“科技與狠活”

汽車要聞

置換補貼價4.28萬起 第五代宏光MINIEV正式上市

態度原創

數碼
教育
旅游
本地
家居

數碼要聞

華碩新款商務本ExpertBook B3 G1,配置超豐富!

教育要聞

把 “玩” 卷成天花板!十一系這所成員校的優質秘訣藏不住了

旅游要聞

老年人友好型旅游正走俏,各國探索適老旅游

本地新聞

在濰坊待了三天,沒遇到一個“濰坊人”

家居要聞

曲線華爾茲 現代簡約

無障礙瀏覽 進入關懷版