337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

Claude Mythos核心架構開源！22歲天才一人破解，融合DeepSeek思路

2026-04-20 17:09:52　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：桃子

【新智元導讀】Claude Mythos核心架構，竟被一個22歲天才扒了個精光！OpenMythos現已全開源，不靠堆參數，原地「循環思考」16次就能推理。閉源實驗室的護城河，真的還在嗎？

簡直太瘋狂了！

Anthropic捂得最嚴實的Claude Mythos，竟被一個22歲的年輕人扒開了。

不是泄露，不是內部員工跳槽帶出來的。

是一個叫Kye Gomez的初創CEO，以第一性原理，硬生生把Claude Mythos的核心架構從頭推導了出來。

更炸裂的是，他把這一項目——OpenMythos全開源了。

復現帖引近100萬人圍觀

一時間，全網都坐不住了，網友們紛紛驚嘆Mythos背景精妙的設計。

不堆參數，原地「循環思考」16次

先說結論，Kye Gomez認為——

Claude Mythos的核心不是一個更大的Transformer，而是一種叫做「循環深度Transformer」（Recurrent-Depth Transformer, RDT）的架構。

說白了就是，同一套權重，在一次前向傳播里循環跑最多16次。

傳統大模型像蓋高樓，一層一層往上堆參數。100層不夠就200層，200層不夠就500層。

參數越多，模型越大，顯存吃得越猛，訓練成本越恐怖。

但RDT完全換了一個思路：不蓋高樓，原地跑圈。

模型只有一個核心計算塊，但這個塊會被反復執行。每循環一次，隱藏狀態就更新一次，就相當于「多想了一步」。

而且所有的思考都在連續潛空間里默默進行——不用像思維鏈（CoT）那樣，每一步都吐出可見的token。

這不是重復計算，是迭代推理。

架構全拆解：三段式設計

整個OpenMythos的架構分三段：

Prelude（序曲）→ Recurrent Block（循環核心）→ Coda（終章）

Prelude和Coda是標準的Transformer層，各跑一次。

真正的計算核心是中間的「循環塊」，它最多循環16次，每次循環的更新規則是：

h_{t+1} = A·h_t + B·e + Transformer(h_t, e)

其中e是Prelude編碼后的原始輸入，每一步都會被重新注入，防止模型在循環中「跑偏」。

MoE給廣度，循環給深度

光靠循環能解釋Mythos推理的「深度」，但解釋不了廣度。

OpenMythos在循環核心的每個FFN層，都替換成了MoE層，設計參考了DeepSeek-MoE：

大量細粒度的路由專家；
每個token只激活其中一小部分；
少量「共享專家」始終激活，負責吸收跨領域的通用知識。

最精妙的一點，隨著隱藏狀態h_t在循環中不斷演化，路由器在每一層循環深度會選擇不同的專家子集。

也就是說，雖然權重共享，但每次循環的計算路徑完全不同：

MoE提供廣度，循環提供深度。

項目地址：https://github.com/kyegomez/OpenMythos

注意力機制默認使用「多潛變量注意力」（Multi-Latent Attention），來自DeepSeek-V2，把KV緩存壓縮成低秩潛變量，在生產規模下能實現10-20倍的KV顯存節省。

三個額外機制保證循環穩定性：LTI約束注入（譜半徑強制小于1）、自適應計算時間（ACT）逐位置停機、以及深度級LoRA適配器讓每次迭代都有獨立的行為調整能力。

細思極恐，這套設計精密得像一臺瑞士鐘表。

770M打平1.3B，參數效率直接翻倍

這不是嘴上說說。

此前，來自Parcae團隊的實驗數據：一個770M參數的循環模型，在同等訓練數據下，能達到1.3B標準Transformer的下游任務質量。

換句話說——用一半的參數，干了同樣的活。

這對整個行業意味著什么？

對消費級硬件來說，這是天大的利好。以前跑個像樣的模型，沒有A100你連門都進不了。

現在呢？推理深度是時間換空間——你不需要更多的顯存，只需要多跑幾圈。

更重磅的是，這徹底改寫了AI的Scaling法則。以前拼的是誰的參數多、誰的GPU多、誰的電費賬單厚。

現在的規則變了：未來最強的模型，不是參數最多的，而是想得最多次的。

不過，作者也表示，這目前只是理論上的說法，還需要保留一些意見。

高中畢業，就當上了CEO

這位扒開22歲Claude Mythos黑箱的大男孩Kye Gomez，是Swarms的創始人，之前還領導過Agora Labs。

他的研究重點是——大規模多智能體系統、替代模型架構和多模態模型。

個人主頁顯示，Kye Gomez高中畢業之后，就開始投身于創業。

在2021年-2024年間，他同時擔任了三家公司的聯創/CEO，創建立了一個以「APAC」為品牌的生態體系。

其覆蓋了AI深科技、媒體、食品科技等多個領域。

22歲小哥，開源了Anthropic神級模型

這件事最讓人震撼的，不是架構本身有多厲害。

是一個22歲的創業者，只用公開論文和第一性原理，就把Anthropic藏了一年的黑箱直接復現了出來。

還全開源了，而且只要幾行代碼就能跑。

這意味著什么？

閉源實驗室的架構優勢，正在以肉眼可見的速度消失。

FT最新報道中，Dario Amodei重磅預測，中國將在12個月內，完全復刻出具備Claude Mythos級別能力的大模型。

針對外界對LLM性能是否觸及天花板的質疑，Amode用一句富有詩意的話給出了回應——

彩虹沒有盡頭，只有彩虹本身。

他強調，目前完全看不到技術放緩的跡象。

當一個人用公開信息就能重建最核心的技術，護城河就不再是架構了。

參考資料：

https://x.com/KyeGomezB/status/2045659150340723107?s=20

https://github.com/kyegomez/OpenMythos

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

黃仁勛訪談“失控”背后：總有一件事必須發生，把電子變成Token

鈦媒體APP 2026-04-21 08:47:54
0 跟貼 0
激光雷達競爭加速升維，禾賽CTO向少卿：從“看見世界”到“理解世界”，物理AI落地仍面臨關鍵制約

每日經濟新聞 2026-04-21 11:09:07
0 跟貼 0

兩個神級原理，看完直接漲知識

快樂圖鑒 2026-04-20 10:51:47
1 跟貼 1

Mythos架構被22歲小伙“逆推”開源了！MoE和注意力借鑒DeepSeek

量子位 2026-04-20 16:05:47
9 跟貼 9
全網最詳細的流量計原理視頻講解！

宇宙科學探索 2026-04-17 15:52:32
1 跟貼 1

這是什么原理？

繽果綜藝 2026-04-20 15:06:00
0 跟貼 0

“DeepSeek啟動融資”消息引爆創投圈！資本布局大模型賽道邏輯生變

每日經濟新聞 2026-04-20 21:56:01
0 跟貼 0
行動奇點降臨！Mythos把AI從「會說」跨進「動手」時代

新智元 2026-04-21 11:03:13
0 跟貼 0

神秘現象引發好奇，究竟暗藏什么原理，快來一探究竟

笑的牙癢癢 2026-04-18 00:00:00
0 跟貼 0
裝雞蛋神操作，什么原理啊？

博聞視角 2026-04-21 11:15:30
0 跟貼 0
從制造到智能的底層重構汽車業正在發生“物理AI改命”

環球網資訊 2026-04-20 18:35:08
0 跟貼 0
大哥往水里加入黑科技，下秒發生神奇一幕，這是什么原理！

青青醬愛搞笑 2026-04-21 10:57:10
3 跟貼 3
「中國版Grok上車」分水嶺：階躍交出首份量產答卷

雷峰網 2026-04-20 18:37:07
0 跟貼 0
如何造原子彈的原理早就公開了，為何還有很多國家造不出來？

真貓爺的漁場 2026-04-21 10:48:15
0 跟貼 0
二游大世界，迎來「DeepSeek時刻」

游戲葡萄 2026-04-21 10:01:37
0 跟貼 0
電動車剎車原理，內部結構一目了然，多年疑惑瞬間被解開！

杰克愛生活 2026-04-18 08:47:49
0 跟貼 0
全民閱讀活動周，一起來讀原著、學原文、悟原理

人民資訊 2026-04-20 20:59:44
0 跟貼 0
女子乘船時同大雁“齊飛”，兩手輕撫托舉畫面和諧美好

北青網-北京青年報 2026-04-21 04:02:12
688 跟貼 688
男子爬上泰山“五岳獨尊”石刻拍照，景區：將核查其身份進行處理

揚子晚報 2026-04-17 12:09:40
1288 跟貼 1288
黃仁勛：DeepSeek若在華為芯片上首發，對美國將是災難！

快科技 2026-04-20 13:52:58
1 跟貼 1
解放軍133號艦艇編隊從橫當水道進入太平洋專家解讀

環球網資訊 2026-04-20 12:17:06
165 跟貼 165
V8發動機模型

制造科技 2026-04-19 17:41:19
0 跟貼 0
丈夫展示翻鍋技術，妻子不服氣模仿，結果竟然憑空消失！

鴨嘴愛搞笑 2026-04-20 13:00:55
1 跟貼 1
保價2000元機蓋運輸中損壞，德邦理賠只肯賠1300元；車主：我不要錢了，你賠我一個機蓋總可以吧

大風新聞 2026-04-20 19:12:04
612 跟貼 612
川崎 H2R模型摩托

制造科技 2026-04-16 21:58:46
15 跟貼 15
黎巴嫩再成戰場民眾：在這沒有人沒有失去過親近的人

新京報 2026-04-20 08:22:24
875 跟貼 875
快評星途EX7：技術下放與價值升維，這次突圍成了？

車壹圈 2026-04-20 09:03:28
0 跟貼 0
驗資3000萬每日預約名單仍排滿，高凈值人群“排隊”看房，4月的杭州樓市是高端局

都市快報橙柿互動 2026-04-20 14:35:53
142 跟貼 142
殲-35A裝的果然是它：12噸推力，一個參數直接打破F-35神話

軍武時間線 2026-04-19 19:32:18
0 跟貼 0
【硬核拆解Claude Code】為什么Claude是最強 Agent？四層架構 + 記憶壓縮 +

盧菁老師 2026-04-20 11:08:43
0 跟貼 0
突然變強！速度翻4倍，GPT Pro驚現「神級」操作，網友懷疑GPT-5.5已就位

新智元 2026-04-20 17:10:50
0 跟貼 0
深圳一火鍋店招985和211大學應屆生儲備店長，從服務員做起，門店負責人：本科生就行，已有985管培生

極目新聞 2026-04-20 14:14:59
343 跟貼 343
高峰期作業、粗暴噴灑！深圳市民吐槽灑水車成 “擾民車”

南方都市報 2026-04-20 23:12:18
178 跟貼 178
浦東新添一家三甲醫院，上海長征醫院浦東院區明起面向社會公眾服務

澎湃新聞 2026-04-20 13:58:26
461 跟貼 461
首發EMB線控制動技術星途EX7上市搶先置換價19.49萬起

汽車相對論 2026-04-20 21:45:43
3 跟貼 3
上海一“滬A黃牌”摩托車起價34萬將被拍賣，車身估值2500元，車牌值48萬

極目新聞 2026-04-20 13:32:56
286 跟貼 286
fate系列中的中國體系是什么樣的？迷人的老祖宗依舊權威！

阿軒速看 2026-04-19 00:22:04
0 跟貼 0
廣西一小學食堂員工疑多次把營養午餐帶回家，官方通報：系將剩余飯菜帶回家喂養家禽，不存在克扣學生營養午餐情況

大象新聞 2026-04-21 09:15:04
190 跟貼 190
樊振東作為戰略投資人觀戰美職乒聯

大風新聞 2026-04-21 11:21:40
67 跟貼 67
鄭柵潔主持召開民營企業座談會

界面新聞 2026-04-20 17:54:34
196 跟貼 196

俄專家終于說出大實話，一旦爆發海戰，全世界僅有一國能擊敗美軍

俄專家終于說出大實話，一旦爆發海戰，全世界僅有一國能擊敗美軍

云舟史策

2026-04-21 07:18:01

徐帆回應離婚5個月，馮小剛近況曝光，他的“小心思”再藏不住了

徐帆回應離婚5個月，馮小剛近況曝光，他的“小心思”再藏不住了

天天熱點見聞

2026-04-19 08:13:15

又一伊朗裔女子在美被捕！被控為伊朗販賣軍火，若罪名成立或獲刑20年

又一伊朗裔女子在美被捕！被控為伊朗販賣軍火，若罪名成立或獲刑20年

紅星新聞

2026-04-20 17:49:36

精神小妹的生活原來是這樣的！網友：終于知道她們為啥都這么瘦了

精神小妹的生活原來是這樣的！網友：終于知道她們為啥都這么瘦了

深度報

2026-02-11 23:35:03

鹿晗生日傳好消息，眾星發聲，關曉彤態度變了，懸著的心終于放下

鹿晗生日傳好消息，眾星發聲，關曉彤態度變了，懸著的心終于放下

翰飛觀事

2026-04-20 22:12:08

上海女子晨跑忘記穿內衣，汗濕后輪廓很明顯，被路人拍下傳到抖音

上海女子晨跑忘記穿內衣，汗濕后輪廓很明顯，被路人拍下傳到抖音

解說阿洎

2026-04-21 00:08:30

4月21日人民幣對美元中間價調升54個基點

4月21日人民幣對美元中間價調升54個基點

證券時報

2026-04-21 09:52:04

蘋果新CEO特努斯曾帶隊推出iPhone17系列，在喬布斯手下工作過，庫克為其導師；庫克：特努斯25年來對蘋果的貢獻數不勝數，是正確人選

蘋果新CEO特努斯曾帶隊推出iPhone17系列，在喬布斯手下工作過，庫克為其導師；庫克：特努斯25年來對蘋果的貢獻數不勝數，是正確人選

魯中晨報

2026-04-21 11:20:10

存在致死風險！1.8萬臺PC電源召回：呼吁用戶立即停用

存在致死風險！1.8萬臺PC電源召回：呼吁用戶立即停用

快科技

2026-04-20 19:07:44

CBA公司給迪亞洛開出了新罰單！

CBA公司給迪亞洛開出了新罰單！

體育哲人

2026-04-21 10:02:01

英國超新星穆迪搶丁俊暉風頭，戴維斯：他或破最年輕世界冠軍紀錄

英國超新星穆迪搶丁俊暉風頭，戴維斯：他或破最年輕世界冠軍紀錄

楊華評論

2026-04-20 21:00:34

中國紅會被國際紅會拒絕承認的原因，善款規則讓自己人都憤怒

中國紅會被國際紅會拒絕承認的原因，善款規則讓自己人都憤怒

干史人

2025-01-23 07:05:02

美國尷尬了，打壓了6年，華為5G還是全球第一！

美國尷尬了，打壓了6年，華為5G還是全球第一！

科技專家

2026-04-13 15:40:55

不到24小時，美國迎來3個噩耗，特朗普或將下臺，伊最高領袖下場

不到24小時，美國迎來3個噩耗，特朗普或將下臺，伊最高領袖下場

知法而形

2026-04-20 12:08:23

曾高喊打敗美帝：如今卻全家跑去美國，84歲活成這樣，引人熱議！

曾高喊打敗美帝：如今卻全家跑去美國，84歲活成這樣，引人熱議！

小莜讀史

2026-04-20 22:58:35

歷史老師跌入“無人區”：某高中20人教研組，近一半無學生可教

歷史老師跌入“無人區”：某高中20人教研組，近一半無學生可教

聽心堂

2026-03-31 15:52:04

我今年55了，想用血淚教訓告訴你：不要跟任何人，包括你的父母、子女、枕邊人，分享這4件事

我今年55了，想用血淚教訓告訴你：不要跟任何人，包括你的父母、子女、枕邊人，分享這4件事

東林夕亭

2026-03-27 09:07:57

阿爾卡拉斯談法網：不會強行復出，長遠生涯比一時參賽更重要

阿爾卡拉斯談法網：不會強行復出，長遠生涯比一時參賽更重要

懂球帝

2026-04-21 09:07:21

國臺辦果然沒看錯，鄭麗文真面目被徹底揭露！小算盤到此為止了

國臺辦果然沒看錯，鄭麗文真面目被徹底揭露！小算盤到此為止了

比利

2026-01-23 12:41:53

雄鹿有意聘請詹金斯出任新帥！雙方商討建隊方向魔術也可能搶他

雄鹿有意聘請詹金斯出任新帥！雙方商討建隊方向魔術也可能搶他

羅說NBA

2026-04-21 08:05:08

AI產業主平臺領航智能+時代

15025文章數 66793關注度

往期回顧全部

科技要聞

重磅官宣：庫克卸任，特努斯接任蘋果CEO

頭條要聞

7歲男孩高燒40℃渾身"黑化"面臨截肢只因父母1個疏忽

頭條要聞

7歲男孩高燒40℃渾身"黑化"面臨截肢只因父母1個疏忽

體育要聞

“被優化”8年后，國乒方博決定換一條路重新上場

娛樂要聞

周潤發時隔16年再賣樓，變現數億資產

財經要聞

減速機訂單已排到明年！

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻我腿軟了

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

家居

游戲

時尚

旅游

教育要聞

成都鹽外：黨建引領思政鑄魂一場跨越學段的“同心筑夢”之旅

家居要聞

詩意光影窺見自然之境

自然慢調慢享時光
法式線條時光靜淌
智能舒適簡約風尚

育碧確認《刺客信條：黑旗》重制版將于4月24日正式公開

“爆冷”又如何？陳法拉的人生本就是一場逆襲大戲

旅游要聞

池州青陽：春日山水入畫來

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版