337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Claude強(qiáng)到不敢發(fā)的Mythos,被質(zhì)疑用了字節(jié)Seed技術(shù)

0
分享至

夢晨 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI


Claude最強(qiáng)“神話”模型,可能用到來自字節(jié)的技術(shù)?

這條猜測直接沖上熱搜榜。



這款“強(qiáng)到不敢公開發(fā)布”的Mythos模型,確實(shí)刺激了人們對下一代LLM架構(gòu)的想象。

社區(qū)正在熱烈討論它是否采用了循環(huán)語言模型(Looped Language Model)架構(gòu)。

這個概念來自字節(jié)Seed團(tuán)隊(duì)與多個高校合作的一篇論文,Yoshua Bengio也參與其中。



關(guān)鍵線索在于Anthropic公布的一組測試數(shù)據(jù)。

字節(jié)論文指出,圖搜索是循環(huán)算法相比標(biāo)準(zhǔn)RLVR具有巨大理論優(yōu)勢的領(lǐng)域之一。

再看Mythos,正是在廣度搜索優(yōu)先的圖搜索測試GraphWalks BFS中,超越對手GPT5.4最多。



80%對21.4%,接近4倍的差距。

在其他類型的任務(wù)上,并沒有出現(xiàn)如此異常的分差。

說明這種進(jìn)步很可能不是來自通用的Scaling Law,而是架構(gòu)創(chuàng)新

循環(huán)語言模型:同一層”多轉(zhuǎn)幾圈”,小模型碾壓大模型

GraphWalks BFS測試,就是給模型一個復(fù)雜的圖結(jié)構(gòu),讓它做廣度優(yōu)先搜索,從起點(diǎn)出發(fā),一層一層地訪問所有相鄰節(jié)點(diǎn)。

標(biāo)準(zhǔn)Transformer處理這類問題只能一次前向傳播,從頭走到尾,輸出結(jié)果,沒有“迭代”這個概念。

Mythos在圖遍歷上拿到了80%的分?jǐn)?shù),表明它內(nèi)部很可能在“”反復(fù)計算”,對同一組信息來回處理了好幾遍。

那么什么樣的架構(gòu)能實(shí)現(xiàn)“反復(fù)計算”?

字節(jié)Seed團(tuán)隊(duì)在論文中提出LoopLM循環(huán)語言模型。



簡單總結(jié)LoopLM有三個特點(diǎn)。

1、不寫長文思考,在模型內(nèi)部潛空間迭代,不額外輸出更多token。

2、簡單題少想幾步,難題多想幾步,自動調(diào)節(jié)。

3、預(yù)訓(xùn)練時就學(xué) “怎么在潛空間思考”,而不是只學(xué) “怎么預(yù)測下一個token”。

在實(shí)驗(yàn)中,團(tuán)隊(duì)訓(xùn)練了Ouro系列循環(huán)語言模型,內(nèi)置了循環(huán)思考。



測試結(jié)果,1.4B的Ouro模型性能對標(biāo)約4B的傳統(tǒng)模型。2.8B的Ouro模型相當(dāng)于8B–12B的傳統(tǒng)模型。



至于循環(huán)模型的能力提升來自何處,論文詳細(xì)分析了知識存儲vs知識操作的區(qū)別。

知識存儲(Knowledge Storage)的容量是有限的,大約每個參數(shù)2bits,不管用什么架構(gòu),這個數(shù)字基本不變。

循環(huán)也不會讓你“記住”更多東西。

但知識操作(Knowledge Manipulation)不一樣,把已知事實(shí)組合起來做多跳推理、執(zhí)行程序、搜索圖結(jié)構(gòu),這類能力隨循環(huán)步數(shù)和訓(xùn)練tokens指數(shù)級增長。

換句話說,循環(huán)模型沒有給AI一個更大的知識庫,但它讓AI在知識庫庫里的搜索和組合能力提升了一個量級。

那么Mythos究竟是不是循環(huán)模型架構(gòu),有人總結(jié)出除了GraphWalks之外的更多線索。



三條線索指向循環(huán)模型架構(gòu)

第一條線索,也就是廣度優(yōu)先圖搜索測試結(jié)果。

Mythos除了分?jǐn)?shù)是GPT5.4的4倍,比上一代Opus提升幅度也異常大。



第二條線索,Anthropic報告Mythos每個任務(wù)使用的token數(shù)量是Opus4.6的1/5,但速度更慢

(價格也貴5倍?。?/p>

這在標(biāo)準(zhǔn)Transformer框架下很難說得通,token少,生成步驟就少,應(yīng)該更快才對。

但循環(huán)模型剛好解釋了這個矛盾:推理不發(fā)生在token層面,而是發(fā)生在潛空間,計算量花在了看不見的地方。

線索三,Mythos在網(wǎng)絡(luò)安全方面非常突出。

Mythos在CyberGym測試上拿到83.1%,Opus4.6是66.6%,領(lǐng)先近17個百分點(diǎn)。

以及找到上千個零日漏洞,主流操作系統(tǒng)和瀏覽器全都沒逃過。

漏洞發(fā)現(xiàn)的本質(zhì)就是對控制流圖做遍歷。找到一條從輸入到危險函數(shù)的路徑,也就是圖的可達(dá)性問題。

又是圖遍歷。又是循環(huán)架構(gòu)的天生強(qiáng)項(xiàng)。

說了這么多,終歸只是大家的猜測,Anthropic沒有公開任何關(guān)于Mythos架構(gòu)的信息,很可能以后也不會公開。

但有一句話值得思考:

Scaling Law改善一切,相對均勻,架構(gòu)創(chuàng)新在匹配其歸納偏置的任務(wù)上創(chuàng)造異常尖峰值。



循環(huán)Transformer的歸納偏置就是迭代圖算法。Mythos的異常尖峰,恰好出現(xiàn)在圖遍歷任務(wù)上。

Anthropic不說,但測試數(shù)據(jù)已經(jīng)替它說了。

字節(jié)論文:
https://arxiv.org/abs/2510.25741

參考鏈接:
[1]
https://x.com/ChrisHayduk/status/2042711699413926262
[2]
https://aiia.ro/blog/claude-mythos-looped-language-model-theory

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
直降1200!特斯拉家充樁限時1599元 車主必沖

直降1200!特斯拉家充樁限時1599元 車主必沖

快科技
2026-04-13 15:35:05
都靈后衛(wèi)3年前拒成國米冠軍拼圖,重傷失業(yè)后攤牌:本可以踢歐冠決賽

都靈后衛(wèi)3年前拒成國米冠軍拼圖,重傷失業(yè)后攤牌:本可以踢歐冠決賽

競技風(fēng)云錄
2026-04-13 17:43:55
看上去像“公務(wù)員”,其實(shí)連編制都沒有的6個職業(yè)

看上去像“公務(wù)員”,其實(shí)連編制都沒有的6個職業(yè)

細(xì)說職場
2026-04-12 17:02:40
別慌!2026北京幼升小“最難入學(xué)年”神話破滅,數(shù)據(jù)真相大揭秘!

別慌!2026北京幼升小“最難入學(xué)年”神話破滅,數(shù)據(jù)真相大揭秘!

鬼菜生活
2026-04-13 17:50:08
反華反到大動脈,高市好日子不多了?日媒交底:自民黨正找替代者

反華反到大動脈,高市好日子不多了?日媒交底:自民黨正找替代者

史行途
2026-04-12 18:49:07
雷軍曬小米員工運(yùn)動會,被吐槽:“周末辦活動,占用休息時間”

雷軍曬小米員工運(yùn)動會,被吐槽:“周末辦活動,占用休息時間”

歪歌社團(tuán)
2026-04-12 01:34:22
臺灣創(chuàng)投圈的大佬蔣友松最近砸出了一個讓整個島內(nèi)政壇炸鍋的決定

臺灣創(chuàng)投圈的大佬蔣友松最近砸出了一個讓整個島內(nèi)政壇炸鍋的決定

小馬姨
2026-04-12 13:10:53
上午10點(diǎn)!北京國安做出重要決定:申訴廖力生手球+韋世豪逃紅牌

上午10點(diǎn)!北京國安做出重要決定:申訴廖力生手球+韋世豪逃紅牌

球場新視角1號
2026-04-13 10:48:49
確認(rèn)了!廣東隊(duì)被迫裁掉薩姆納,朱芳雨將簽下第五名大外援?

確認(rèn)了!廣東隊(duì)被迫裁掉薩姆納,朱芳雨將簽下第五名大外援?

緋雨兒
2026-04-13 09:21:08
湖南百米白燈籠不是炫喪,也不是傳統(tǒng),官方介入,真相浮出水面

湖南百米白燈籠不是炫喪,也不是傳統(tǒng),官方介入,真相浮出水面

社會日日鮮
2026-04-12 13:26:16
伊朗繳獲美軍先進(jìn)激光武器,美擔(dān)心:如果中俄拿到,恐遭破解!

伊朗繳獲美軍先進(jìn)激光武器,美擔(dān)心:如果中俄拿到,恐遭破解!

阿龍聊軍事
2026-04-13 16:42:45
本來窮得好好的,非要闖一闖,結(jié)果成老賴!半生努力換一身負(fù)債

本來窮得好好的,非要闖一闖,結(jié)果成老賴!半生努力換一身負(fù)債

夜深愛雜談
2026-04-11 11:42:57
芒果臺踩雷!趙子琪被淘汰后直播開撕,她的過往連張朝陽都忌憚

芒果臺踩雷!趙子琪被淘汰后直播開撕,她的過往連張朝陽都忌憚

小徐講八卦
2026-04-12 06:23:01
巴薩客戰(zhàn)馬競名單:亞馬爾領(lǐng)銜,貝爾納爾帶傷入列

巴薩客戰(zhàn)馬競名單:亞馬爾領(lǐng)銜,貝爾納爾帶傷入列

體壇周報
2026-04-13 18:19:19
河北邯鄲一佳人太漂亮了,五官精致, 身高169,美得讓人移不開眼

河北邯鄲一佳人太漂亮了,五官精致, 身高169,美得讓人移不開眼

小椰的奶奶
2026-04-11 17:18:32
3月銷冠還是Model Y:網(wǎng)上沒贏過,現(xiàn)實(shí)沒輸過

3月銷冠還是Model Y:網(wǎng)上沒贏過,現(xiàn)實(shí)沒輸過

小南看車
2026-04-11 07:04:23
“留學(xué)回來,15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒有

“留學(xué)回來,15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒有

皓皓情感說
2026-04-10 22:54:59
風(fēng)向都變了!以美國為首的多國認(rèn)為:中國已在換電等關(guān)鍵領(lǐng)域崛起

風(fēng)向都變了!以美國為首的多國認(rèn)為:中國已在換電等關(guān)鍵領(lǐng)域崛起

潮鹿逐夢
2026-04-11 11:22:49
張凌赫軍裝造型火海外 碾壓韓劇男主引熱議

張凌赫軍裝造型火海外 碾壓韓劇男主引熱議

喜歡歷史的阿繁
2026-04-12 02:15:42
馬筱梅又“捅婁子”,剛到北京一句話又惹爭議,網(wǎng)友:吃飽了撐的

馬筱梅又“捅婁子”,剛到北京一句話又惹爭議,網(wǎng)友:吃飽了撐的

攬星河的筆記
2026-04-13 18:45:55
2026-04-13 19:48:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12466文章數(shù) 176449關(guān)注度
往期回顧 全部

科技要聞

"抄作業(yè)"近四年,馬斯克版微信周五上線

頭條要聞

媒體:歐爾班敗選不僅是一國之事 牽扯到與中國的關(guān)系

頭條要聞

媒體:歐爾班敗選不僅是一國之事 牽扯到與中國的關(guān)系

體育要聞

一支球隊(duì)不夠爛,也是一種悲哀

娛樂要聞

賈玲減重后現(xiàn)身馮鞏生日宴 身材未反彈

財經(jīng)要聞

起底AI"造黃"灰產(chǎn):19.9元"一鍵脫衣"

汽車要聞

不止命名更純粹 領(lǐng)克10/10+要做純電操控新王

態(tài)度原創(chuàng)

旅游
本地
游戲
公開課
軍事航空

旅游要聞

1元一朵,成都“玫瑰爺爺”花田走紅,游客:實(shí)現(xiàn)“玫瑰自由”

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

索尼重量級大作來了!頑皮狗全新IP首曝 2027年時間定了

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普:今晚10點(diǎn)封鎖伊朗 對北約非常失望

無障礙瀏覽 進(jìn)入關(guān)懷版