337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Meta億元天團(tuán)首個(gè)大模型交卷!耗時(shí)九個(gè)月,一雪Llama前恥

0
分享至

再見(jiàn)了,所有的羊駝。

亞歷山大王帶隊(duì)9個(gè)月從零重構(gòu)Meta所有AI技術(shù)棧,在不斷的質(zhì)疑中交出超級(jí)智能實(shí)驗(yàn)室第一個(gè)模型:

主打原生多模態(tài)的Muse Spark



模型發(fā)布后,Meta股價(jià)火速拉升約7%,中間一度漲超近10%,當(dāng)日整體上漲6%左右。

市場(chǎng)的反應(yīng)可謂相當(dāng)熱烈。

隨手一扒你就會(huì)發(fā)現(xiàn),這款模型背后藏著不少我們熟悉的高手:思維鏈作者Jason Wei、o1核心貢獻(xiàn)者Hyung Won Chung、被小扎天價(jià)挖來(lái)的余家輝、擴(kuò)散模型核心人物宋飏……

嗯?當(dāng)這群人湊在一起,很明顯你就會(huì)找到一個(gè)關(guān)鍵詞:推理

沒(méi)錯(cuò),據(jù)Jason Wei爆料,9個(gè)月前他們坐在一起討論時(shí),首先寫下的就是一款用于推理的llama模型腳本,而現(xiàn)在,完全體終于誕生。

而頂尖高手+耗時(shí)9個(gè)月打磨,Muse Spark也總算讓Meta在第三方測(cè)評(píng)中趕上第一梯隊(duì),一雪llama 4帶來(lái)的前恥。



而且很有意思的一點(diǎn)是,Meta這次一反常態(tài),沒(méi)有反復(fù)強(qiáng)調(diào)自己拿了多少SOTA,而是稍顯克制地表示:

Muse Spark在多模態(tài)感知、推理、健康和自主任務(wù)方面表現(xiàn)不錯(cuò),但在編程長(zhǎng)時(shí)間自主運(yùn)行方面仍與對(duì)家的頂尖模型存在差距。

咳咳,看來(lái)之前l(fā)lama 4確實(shí)給Meta留下了心理陰影(doge)。

另外,Muse Spark的出生也終于讓長(zhǎng)期以來(lái)有關(guān)“Meta開閉源”的討論蓋棺定論:

這次是真閉源了

目前這款模型已上線Meta網(wǎng)站和APP,API僅向部分合作伙伴開放。

(不過(guò)亞歷山大王還是留了個(gè)口子,表示“計(jì)劃未來(lái)開源后續(xù)版本”)

“Meta回來(lái)了”

老規(guī)矩,先看一波測(cè)評(píng)成績(jī)。



作為Meta迄今最強(qiáng)大的模型,Muse Spark這次主要在三個(gè)方面表現(xiàn)突出:

一是多模態(tài)理解能力

不管是看論文圖表還是屏幕,各項(xiàng)得分要么第一、要么和Gemini 3.1 Pro、GPT 5.4等不相上下。

從網(wǎng)友們的測(cè)試來(lái)看,它好像尤為擅長(zhǎng)圖片轉(zhuǎn)代碼。



當(dāng)然文本能力也不差(doge),在網(wǎng)友的激情測(cè)試中,它就火速通過(guò)了新版弱智吧風(fēng)格的洗車測(cè)試。

100米外有個(gè)洗車店,我該開車去還是走路去。
Muse Spark:洗車當(dāng)然要把車開過(guò)去,但沒(méi)必要搞得跟上下班通勤似的。

(當(dāng)然也不排除是數(shù)據(jù)污染的問(wèn)題,畢竟問(wèn)題出來(lái)也挺久了…)



再一個(gè)就是工具調(diào)用能力,測(cè)評(píng)情況也和多模態(tài)理解能力類似。

以及這次Muse Spark著重強(qiáng)調(diào)的醫(yī)學(xué)能力

由于和1000+醫(yī)生展開了合作,它不僅在開放式健康問(wèn)答HealthBench Hard上拿到42.8的最高分,而且在多模態(tài)醫(yī)學(xué)問(wèn)答MedXpertQA MM中位居前列。

不過(guò)短板我們開頭也說(shuō)了,Muse Spark仍在編程和Agent類任務(wù)上與其他頂尖選手存在差距。

可能也是為了盡量彌補(bǔ)這一點(diǎn),他們這次還專門推出了Contemplating沉思模式

主要是讓多個(gè)Agent同時(shí)思考同一個(gè)問(wèn)題,然后匯總結(jié)果找出最好的。

在這套打法下,Muse Spark就能和Gemini Deep Think、 GPT Pro這類極限推理模式展開正面PK了。

比如在“人類最后的考試”中,Muse Spark明顯壓過(guò)一頭(不過(guò)在物理奧賽理論題中還是略遜一籌)。

(目前沉思模式正在Meta網(wǎng)站灰度測(cè)試)



另外值得一提的是,Meta這次無(wú)預(yù)告直接上線了“購(gòu)物模式”。

亞歷山大王表示,模型會(huì)結(jié)合用戶在ins、Facebook、Threads上關(guān)注的創(chuàng)作者和品牌偏好,做個(gè)性化的購(gòu)物推薦。

好好好,這次也不給你討論的機(jī)會(huì)了,之前OpenAI可沒(méi)少因?yàn)閺V告挨罵。



目前,隨著Muse Spark測(cè)評(píng)一同出爐的,還有第三方機(jī)構(gòu)的測(cè)評(píng)。

他們拿到Muse Spark的早期訪問(wèn)權(quán)測(cè)了一波,然后給出了一個(gè)結(jié)論:Meta回來(lái)了!

在關(guān)鍵指標(biāo)人工智能分析指數(shù)上,其得分僅次于Gemini 3.1 Pro、GPT-5.4和Claude Opus 4.6。



這也和Muse Spark自己給出的測(cè)評(píng)成績(jī)差不多。

對(duì)外界而言,初步來(lái)看,Muse Spark確實(shí)把Meta重新帶回了人工智能第一梯隊(duì)。

背后訓(xùn)練細(xì)節(jié)

至于Muse Spark是如何做到這一點(diǎn)的,Meta也公布了背后的訓(xùn)練細(xì)節(jié)。

核心其實(shí)就是亞歷山大王提到的:9個(gè)月重構(gòu)一切

新的基礎(chǔ)設(shè)施、新的架構(gòu)、新的數(shù)據(jù)管道。



具體可以看網(wǎng)友給大家劃的重點(diǎn):

  • 在預(yù)訓(xùn)練階段,能夠以比Llama 4 少10倍以上的計(jì)算量達(dá)到相同的性能水平。
  • 強(qiáng)化學(xué)習(xí)訓(xùn)練展現(xiàn)出平滑且可預(yù)測(cè)的改進(jìn),具有良好的泛化能力和可擴(kuò)展性。
  • Test-time階段,在加入長(zhǎng)度懲罰機(jī)制后,“思維壓縮”開始生效,模型學(xué)會(huì)了用更少的token解決問(wèn)題。



Meta在博客中介紹,過(guò)去9個(gè)月,他們對(duì)Muse Spark的預(yù)訓(xùn)練技術(shù)棧進(jìn)行了全面升級(jí)。

所有改進(jìn)的目標(biāo),都是為了讓每一分算力都能產(chǎn)生更大的價(jià)值。

為了驗(yàn)證效果,他們做了一個(gè)對(duì)比實(shí)驗(yàn):先用一系列小模型擬合出一條“算力-能力”的Scaling曲線,然后計(jì)算要達(dá)到某個(gè)性能水平具體需要多少算力。

結(jié)果發(fā)現(xiàn),相比Llama 4,Muse Spark達(dá)到同樣水平所需要的計(jì)算量低了一個(gè)數(shù)量級(jí)以上(10.3倍)。



預(yù)訓(xùn)練完成后,他們進(jìn)一步用強(qiáng)化學(xué)習(xí)來(lái)提升模型能力。

雖然大規(guī)模RL訓(xùn)練通常很不穩(wěn)定,但他們聲稱自己的新架構(gòu)做到了“穩(wěn)中有進(jìn)”。

如下圖所示,隨著RL訓(xùn)練步數(shù)增加,模型在訓(xùn)練數(shù)據(jù)上的成功率(無(wú)論是單次嘗試還是16次中至少成功一次)呈現(xiàn)對(duì)數(shù)線性增長(zhǎng)。

這說(shuō)明,RL在提升可靠性的同時(shí),沒(méi)有破壞推理的多樣性。

而且在模型從未見(jiàn)過(guò)的任務(wù)上,準(zhǔn)確率同樣在穩(wěn)步提升——這說(shuō)明RL帶來(lái)的能力提升是可預(yù)測(cè)、可泛化的,不是死記硬背。



以及為了讓模型在回答復(fù)雜問(wèn)題之前先“想一想”,團(tuán)隊(duì)仍用強(qiáng)化學(xué)習(xí)訓(xùn)練它具備這種“測(cè)試時(shí)推理”能力。

不過(guò)需要注意,實(shí)踐證明Test-time階段的推理尤為耗費(fèi)token,所以如何精打細(xì)算也是這一階段的重點(diǎn)。

對(duì)此,他們用了兩個(gè)關(guān)鍵手段來(lái)平衡效果與效率:

一是思考時(shí)間懲罰。鼓勵(lì)模型用更短的推理路徑得出正確答案,倒逼它學(xué)會(huì)“思維壓縮”。

二是多智能體協(xié)作。讓多個(gè)模型或模塊協(xié)同工作,在保證響應(yīng)速度不降的前提下提升整體表現(xiàn)。

然后在AIME這類高難度評(píng)測(cè)集上,他們觀察到了一個(gè)有趣的“三階段變化”

模型一開始會(huì)不自覺(jué)延長(zhǎng)思考,希望通過(guò)拉長(zhǎng)推理過(guò)程來(lái)提高正確率。

但這會(huì)馬上觸發(fā)“思考時(shí)間懲罰”,于是模型被迫精簡(jiǎn)推理,學(xué)會(huì)用更少的token解決問(wèn)題。

而在精簡(jiǎn)之后,模型還表現(xiàn)出了擴(kuò)展性能——在高效的基礎(chǔ)上繼續(xù)優(yōu)化解法,最終實(shí)現(xiàn)用更少的資源獲得更強(qiáng)的性能表現(xiàn)。



也不乏翻車的

不過(guò)前面也說(shuō)了,Muse Spark雖然將Meta帶回了第一梯隊(duì),但在編程、Agent類任務(wù)上仍有不足。

這不,模型剛發(fā)布,翻車集錦也來(lái)了……

有人想用它生成網(wǎng)站,結(jié)果3個(gè)請(qǐng)求一個(gè)都沒(méi)實(shí)現(xiàn),而且連最基本的前端都無(wú)。



不過(guò)后來(lái)貼主發(fā)現(xiàn)可能是偶然錯(cuò)誤,模型正常情況下做出來(lái)的前端是這樣的。



一個(gè)簡(jiǎn)單的編程任務(wù),Muse Spark雖生成了一大堆東西,但根本跑不通。

在一個(gè)Python文件里實(shí)現(xiàn)自動(dòng)微分(autograd)和神經(jīng)網(wǎng)絡(luò)。

網(wǎng)友甚至調(diào)侃,模型根本沒(méi)在學(xué),訓(xùn)練了1800個(gè)epoch,損失函數(shù)卻一直卡在同一個(gè)值上沒(méi)動(dòng)過(guò)。

白白浪費(fèi)算力了……

(正常情況下,隨著訓(xùn)練進(jìn)行損失應(yīng)該逐步下降,表明模型在“學(xué)習(xí)”)



所以問(wèn)題來(lái)了,有試過(guò)的朋友覺(jué)得亞歷山大王的首個(gè)模型如何?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
縣長(zhǎng)提拔干部讓人看不懂,組織部長(zhǎng)質(zhì)疑,出事后才知真相

縣長(zhǎng)提拔干部讓人看不懂,組織部長(zhǎng)質(zhì)疑,出事后才知真相

霧島夜話
2026-04-07 12:20:33
孫儷被吳慷仁害慘了!?

孫儷被吳慷仁害慘了!?

八卦瘋叔
2026-04-09 11:28:38
上海公園胖女壓倒櫻花樹后續(xù):當(dāng)事人被找到,已認(rèn)錯(cuò)賠償!

上海公園胖女壓倒櫻花樹后續(xù):當(dāng)事人被找到,已認(rèn)錯(cuò)賠償!

朗威談星座
2026-04-08 16:41:26
42歲江一燕官宣離婚,沒(méi)撕逼沒(méi)狗血,卻看哭無(wú)數(shù)人

42歲江一燕官宣離婚,沒(méi)撕逼沒(méi)狗血,卻看哭無(wú)數(shù)人

東方不敗然多多
2026-04-09 14:25:09
巴黎2-0利物浦,克瓦拉茨赫利亞一條龍,杜埃建功,利物浦0射正

巴黎2-0利物浦,克瓦拉茨赫利亞一條龍,杜埃建功,利物浦0射正

懂球帝
2026-04-09 04:58:22
伊朗停火聲明發(fā)布,全文令人淚目,伊朗要感謝的第一個(gè)居然是中國(guó)

伊朗停火聲明發(fā)布,全文令人淚目,伊朗要感謝的第一個(gè)居然是中國(guó)

諦聽骨語(yǔ)本尊
2026-04-09 14:35:34
四大巨星齊夸趙心童!熱度引發(fā)籍貫之爭(zhēng),到底算哪里人?塵埃落定

四大巨星齊夸趙心童!熱度引發(fā)籍貫之爭(zhēng),到底算哪里人?塵埃落定

觀察鑒娛
2026-04-08 09:36:52
不愧是HBO!奧妹這一脫,太拼了

不愧是HBO!奧妹這一脫,太拼了

來(lái)看美劇
2026-04-08 22:04:30
退休后,永遠(yuǎn)不要在熟人面前,說(shuō)以下6句話,切記切記

退休后,永遠(yuǎn)不要在熟人面前,說(shuō)以下6句話,切記切記

東林夕亭
2026-04-02 16:44:39
終于有了結(jié)果,曾醫(yī)生能保住醫(yī)院的工作,最應(yīng)該感謝的三位貴人!

終于有了結(jié)果,曾醫(yī)生能保住醫(yī)院的工作,最應(yīng)該感謝的三位貴人!

凌風(fēng)的世界觀
2025-11-14 08:38:31
WTT戰(zhàn)報(bào):連丟賽點(diǎn),3對(duì)國(guó)乒一輪游!8強(qiáng)對(duì)陣出爐日本2席馬新各1席

WTT戰(zhàn)報(bào):連丟賽點(diǎn),3對(duì)國(guó)乒一輪游!8強(qiáng)對(duì)陣出爐日本2席馬新各1席

求球不落諦
2026-04-09 12:39:08
太解氣!杜蘭特霸氣回懟狄龍:我最差賽季,都比你巔峰強(qiáng)!

太解氣!杜蘭特霸氣回懟狄龍:我最差賽季,都比你巔峰強(qiáng)!

田先生籃球
2026-04-08 16:40:24
林彪提出接任北京軍區(qū)司令員人選時(shí),毛主席反問(wèn):是四野的人吧?

林彪提出接任北京軍區(qū)司令員人選時(shí),毛主席反問(wèn):是四野的人吧?

歷史龍?jiān)w
2026-04-07 16:40:07
陳光標(biāo)又鬧笑話了,火速刪掉博文!

陳光標(biāo)又鬧笑話了,火速刪掉博文!

蔥哥說(shuō)
2026-04-08 13:12:40
瓦大師爆掉意二哥,TME與阿卡爭(zhēng)八強(qiáng),小豐戰(zhàn)貝雷,奧胖勝菲一姐

瓦大師爆掉意二哥,TME與阿卡爭(zhēng)八強(qiáng),小豐戰(zhàn)貝雷,奧胖勝菲一姐

網(wǎng)球之家
2026-04-09 12:52:20
內(nèi)娛女神劉詩(shī)詩(shī)驚艷蛻變?飽滿身姿暗藏極致女人味,這身材太絕?

內(nèi)娛女神劉詩(shī)詩(shī)驚艷蛻變?飽滿身姿暗藏極致女人味,這身材太絕?

娛樂(lè)領(lǐng)航家
2026-03-10 22:00:04
浙江隊(duì)官方:米特里策損害俱樂(lè)部和聯(lián)賽的形象,隊(duì)內(nèi)罰款6萬(wàn)歐元

浙江隊(duì)官方:米特里策損害俱樂(lè)部和聯(lián)賽的形象,隊(duì)內(nèi)罰款6萬(wàn)歐元

懂球帝
2026-04-08 23:05:08
黃圣依承認(rèn)戀情,拜拜了楊子。

黃圣依承認(rèn)戀情,拜拜了楊子。

美芽
2026-04-07 18:35:39
北京挖出大太監(jiān)李蓮英之墓,開棺后,考古人員被嚇得渾身發(fā)抖

北京挖出大太監(jiān)李蓮英之墓,開棺后,考古人員被嚇得渾身發(fā)抖

歷史人文2
2026-04-05 11:30:03
做藝人沒(méi)有藝德!在上海被抓捕的 4 位明星,你們知道都有誰(shuí)嗎?

做藝人沒(méi)有藝德!在上海被抓捕的 4 位明星,你們知道都有誰(shuí)嗎?

她時(shí)尚丫
2026-02-17 21:56:13
2026-04-09 15:20:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12447文章數(shù) 176447關(guān)注度
往期回顧 全部

科技要聞

Meta凌晨首發(fā)閉源大模型 扎克伯格又行了?

頭條要聞

陳麗華告別儀式舉辦 馬德華:遲重瑞心里很難過(guò)

頭條要聞

陳麗華告別儀式舉辦 馬德華:遲重瑞心里很難過(guò)

體育要聞

8萬(wàn)人面前心臟驟停 現(xiàn)在他還站在球場(chǎng)上

娛樂(lè)要聞

金莎官宣結(jié)婚 與老公孫丞瀟相差18歲

財(cái)經(jīng)要聞

談判基礎(chǔ)已被破壞!霍爾木茲海峽關(guān)閉

汽車要聞

8155芯片+L2智駕 瑞虎5運(yùn)動(dòng)版上市 置換補(bǔ)貼價(jià)6.79萬(wàn)元起

態(tài)度原創(chuàng)

藝術(shù)
親子
本地
時(shí)尚
軍事航空

藝術(shù)要聞

龐茂琨 2026油畫寫生新作

親子要聞

以人類目前的意志力還不足以抵抗這種萌物

本地新聞

建水Color Walk | 古城慢調(diào),掉進(jìn)春天的調(diào)色盤里

ED網(wǎng)紅病,正在掏空年輕女性

軍事要聞

黎真主黨發(fā)射火箭彈 回應(yīng)以違反停火協(xié)議

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版