337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

我用Meta“華人天團”打造的新模型,一張圖復刻了一個“豆包App”

0
分享至


智東西
作者 陳駿達
編輯 云鵬

Meta的“牛油果”模型,終于熟了!

智東西4月9日報道,今天,在成立9個月后,Meta超級智能實驗室(MSL)發布了其首款模型Muse Spark(內部代號牛油果)。這是一個原生的多模態推理模型,支持工具使用、視覺思維鏈和多智能體編排。

在大模型測評平臺Artificial Analysis上,Muse Spark的智能指數直接從Llama 4 Maverick的18分,跳到了52分,介于Claude Sonnet 4.6和Claude Opus 4.6之間,算是進入第一梯隊了。


我們第一時間對模型做了體驗,上傳了一張豆包App的截圖,要求Muse Spark復刻。可以看到Muse Spark的回復風格比較口語化,甚至有一股“豆包味兒”,這可能是因為這一模型主要面向C端用戶。


Muse Spark的生成速度很快,效果也不錯,基本1:1復刻了豆包的頁面,連圖像都還原了。


Muse Spark還通過了小球彈跳測試。有網友感嘆道,時隔1年多,Meta終于發了一款能通過六邊形小球彈跳測試的大模型,這一歷史性時刻值得記錄。


Muse Spark是ScaleAI創始人、Meta首席AI官汪滔(Alexandr Wang)加入Meta 10個月后,交出的首份答卷。


這一結果來的并不容易,此前,在Llama 4遭遇史詩級滑鐵盧后,Meta大刀闊斧地重組了AI團隊,唱衰大語言模型的楊立昆也最終離開。

汪滔稱,Meta在過去9個月從零開始打造AI技術棧,基礎設施、架構、數據管線都是全新的,Muse Spark正是這些努力的成果。

加入Meta的不少華人AI大牛紛紛轉發了這一成果,包括趙晟佳、畢樹超、余家輝、Jason Wei等等。值得一提的是,MSL團隊的華人濃度很高,在轉發新模型的Meta研究員中,從領導到基層員工,許多都是華人。


另據Top華人科創社的報道,Meta還迎來了一位新的華人大牛,前螞蟻集團RL實驗室首席科學家吳翼加盟了Meta MSL,直接向Meta副總裁和MSL聯合負責人Nat Friedman匯報。


Muse Spark是MSL Muse系列模型中的首款,未來還會有更多該系列模型發布。目前Muse Spark已開始逐步推送至Meta旗下的應用和Meta.ai網頁端,不過仍有用戶反映自己使用的模型仍是Llama 3。


同時,“開源”兩個字在相關博客中,一次也未被提及。

體驗鏈接:meta.ai

一、多模態、醫療健康表現突出,智能體和編程仍是短板

從基準測試結果來看,Muse Spark在多模態感知、推理、醫療健康和智能體等領域的表現處于行業第一梯隊。不過,MSL承認這一模型在長程智能體系統和編程工作流方面性能尚有差距。

以下是Muse Spark完整的基準測試成績。需要注意的是,Meta在這里采用了一些有“圖表詐騙”嫌疑的數據呈現方式。乍一看,Muse Spark的所有成績都被標藍,似乎全面領先,但實際上這一模型在圖中的20項基準測試中,拿到的SOTA數量為4個


在多模態能力維度,Muse Spark的表現較有競爭力,在美國大模型圈沒有被拉開明顯代差,基本和GPT-5.4處在同一水平線上。Muse Spark的表現也符合其原生多模態大模型的定位。

作為一款將部署于Meta旗下眾多社交媒體、面向廣大個人用戶的模型,Muse Spark在用戶高頻關注的醫療健康領域同樣沒有掉隊。在HealthBench Hard與MedXpertQA(多模態)兩項評測中均斬獲SOTA,顯然對此進行了重點優化。

Muse Spark本次還發布了“沉思模式(Contemplating mode)”,該模式可協調多個智能體并行推理。這使得Muse Spark能夠與Gemini Deep Think和GPT Pro等前沿模型的極限推理模式相媲美。

開啟“沉思模式”后,Muse Spark在復雜任務中的能力得以提升,比如它在HLE“人類最后的考試”基準測試中,取得了58%的正確率在“前沿科學研究”基準測試中取得了38%的正確率。


二、所需算力資源比Llama 4少一個量級,采用新型強化學習技術棧

跑分之外,這一模型的新定位和背后技術,也值得關注。

Meta稱,Muse Spark是邁向個人超級智能的第一步,它能夠理解用戶所處的世界,多模態能力和醫療健康就是當前的兩個重點。

Muse Spark從底層架構層面,整合了跨領域和工具的視覺信息,在識別、定位方面的能力不錯。這些功能結合起來,可以實現各種交互式體驗。

例如,用戶可以上傳一張游戲畫面截圖,然后讓Muse Spark把它變成一個能真正互動的游戲。


或是告知Muse Spark自己有高膽固醇的問題,并讓Muse Spark基于多模態能力和醫療知識,做一個動態的食物推薦頁面。


Meta在博客中分享的demo也僅僅涉及多模態和醫療健康領域,這或許意味著Muse系列模型最終的用途,仍然是服務于扎克伯格的個人超級智能愿景,而不是單純地追求智能上限。

在技術方面,MSL大幅度提升了算力利用率,與之前的模型Llama 4 Maverick相比,Muse Spark用少一個數量級以上的計算資源就能達到相同的性能。


同時,MSL還在強化學習階段采用了新技術棧,在大規模強化學習中帶來平穩、可預測的性能提升。


三、一手實測:精準識別食物熱量,還給Meta AI眼鏡造了個新品

Muse Spark發布后,我們進行了更多實測。

Muse Spark的多模態能力確實不錯,我們上傳了一個啤酒瓶的照片,讓它分析熱量。Muse Spark一眼就看出了啤酒的品牌、大小,甚至連原圖中肉眼都難以分辨的酒精度都準確識別出來了。


它對于熱量的分析則來自搜索,還把熱量轉換成了我們日常吃的食物,并給出要消耗這些熱量對應的運動量,是比較實用的。


我們緊接著讓Muse Spark給Meta的AI眼鏡做一個宣傳網頁,沒給任何參考。可以看到,在思考過程中Muse Spark主動調用AI生圖模型打造了對應的產品圖片,然后編寫完整頁面代碼,整個過程耗時2分鐘左右,效果如下:


這一網頁的完成度不錯,直接給Meta設計出了一款搭載Muse Spark的新品AI眼鏡。模型還自夸道,這是一個旗艦級的官網,不是普通的落地頁,是按Apple Vision Pro發布會標準做的。

Muse Spark還可用于購物推薦。我們試著讓它搜索一款汽車雨刮器,幾秒鐘就拿到了好幾個選項,并且有對每款產品優勢劣勢的分析和最終購買建議。


結語:牛油果熟了,但Meta的“個人超級智能”仍需耐心

作為Meta超級智能實驗室的首秀,Muse Spark已經展現出躋身第一梯隊的水準,足夠讓人期待未來的Muse系列后續產品。

不過,扎克伯格想要的“個人超級智能”,目前還停留在醫療健康問答、網頁復刻、購物推薦這些相對可控的場景里。距離真正改變數億用戶的交互方式,還有很長的路要走。


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
川崎工程師吐真言:整個日本摩托圈,看到張雪倆字,心就咯噔一下

川崎工程師吐真言:整個日本摩托圈,看到張雪倆字,心就咯噔一下

藍色海邊
2026-04-09 16:33:26
美專家的意見罕見一致,中國兩岸統一時,美國或許只有一條路可走

美專家的意見罕見一致,中國兩岸統一時,美國或許只有一條路可走

錯過美好
2026-04-09 17:42:29
鄭麗文上海午宴演講,黃國昌表態,管碧玲攻擊,卻被打臉,不簡單

鄭麗文上海午宴演講,黃國昌表態,管碧玲攻擊,卻被打臉,不簡單

DS北風
2026-04-09 17:30:11
盤后利好,社保剛剛新進47股,新進股名單出爐,核心有3個邏輯

盤后利好,社保剛剛新進47股,新進股名單出爐,核心有3個邏輯

風風順
2026-04-09 07:03:10
深感痛心!深圳市衛健委深夜發布情況說明

深感痛心!深圳市衛健委深夜發布情況說明

梅斯醫學
2026-04-09 09:21:21
杜鋒險勝青島笑不出來,焦泊喬去向成謎,3位愛將傷缺沖冠恐泡湯

杜鋒險勝青島笑不出來,焦泊喬去向成謎,3位愛將傷缺沖冠恐泡湯

硯底沉香
2026-04-09 17:54:20
被父性侵、被丈夫家暴,死后三天才被發現,“最美趙敏”活的真慘

被父性侵、被丈夫家暴,死后三天才被發現,“最美趙敏”活的真慘

探源歷史
2026-04-09 17:51:34
74年印度吞并錫金,中國拒絕錫金的求助:有三原因,第一個很重要

74年印度吞并錫金,中國拒絕錫金的求助:有三原因,第一個很重要

鶴羽說個事
2026-04-06 21:59:54
比伊朗戰爭更要命,一場大清算正在逼近,華爾街警報拉響了

比伊朗戰爭更要命,一場大清算正在逼近,華爾街警報拉響了

碧珠映紅香
2026-04-09 12:52:33
4周實現100%清除腫瘤!國研TIL療法再傳捷報,狂攻肺癌、腦膠質瘤

4周實現100%清除腫瘤!國研TIL療法再傳捷報,狂攻肺癌、腦膠質瘤

無癌家園i
2026-04-08 12:03:23
洋洋透露馬筱梅過兩天就回京,小孩正在辦證件,張蘭態度很微妙

洋洋透露馬筱梅過兩天就回京,小孩正在辦證件,張蘭態度很微妙

何嗀愛捕漁
2026-04-09 13:17:02
6年后,那個曾揚言讓中國給全世界道歉、被央視開除的阿丘怎樣了

6年后,那個曾揚言讓中國給全世界道歉、被央視開除的阿丘怎樣了

李橑在北漂
2026-04-08 22:45:06
特發信息股價創歷史新高

特發信息股價創歷史新高

證券時報
2026-04-09 15:34:04
43歲男子和富婆車震后,富婆還想要更多,2016年他將51歲富婆殺死

43歲男子和富婆車震后,富婆還想要更多,2016年他將51歲富婆殺死

漢史趣聞
2026-04-06 19:17:12
成龍72歲生日,帶兒子房祖名惠州游玩,手搭兒子肩膀畫面溫馨

成龍72歲生日,帶兒子房祖名惠州游玩,手搭兒子肩膀畫面溫馨

觀察鑒娛
2026-04-09 09:51:18
赫拉德:門將把球擺好后比賽就重新開始了,普維爾卻用手停球

赫拉德:門將把球擺好后比賽就重新開始了,普維爾卻用手停球

懂球帝
2026-04-09 06:42:05
大的要來了?穆杰塔巴擼掉原伊朗革命衛隊總司令,換了個不怕死的

大的要來了?穆杰塔巴擼掉原伊朗革命衛隊總司令,換了個不怕死的

蹲坑看世界
2026-04-09 16:43:24
海風燙臉、荔枝落果,為何海南4月就這么熱?

海風燙臉、荔枝落果,為何海南4月就這么熱?

新京報
2026-04-09 14:20:09
東哥徹底扛不住了?每天燒1.28億,虧損率超94%,終于要止損了

東哥徹底扛不住了?每天燒1.28億,虧損率超94%,終于要止損了

老特有話說
2026-03-15 22:15:14
英超第5也能踢歐冠,切爾西球迷先慌了:這算哪門子安慰獎

英超第5也能踢歐冠,切爾西球迷先慌了:這算哪門子安慰獎

體育硬核說
2026-04-09 17:57:53
2026-04-09 18:39:00
智東西 incentive-icons
智東西
聚焦智能變革,服務產業升級。
11542文章數 117027關注度
往期回顧 全部

科技要聞

Meta凌晨首發閉源大模型 扎克伯格又行了?

頭條要聞

一群人闖進女子剛買的新房砸了兩面墻 物業稱出于好心

頭條要聞

一群人闖進女子剛買的新房砸了兩面墻 物業稱出于好心

體育要聞

8萬人面前心臟驟停 現在他還站在球場上

娛樂要聞

金莎官宣結婚 與老公孫丞瀟相差18歲

財經要聞

停火首日,霍爾木茲僅有4艘船通過

汽車要聞

文飛的回歸 給神行者帶來什么?

態度原創

游戲
房產
藝術
親子
軍事航空

Xbox系統迎核彈級更新!讓微軟女總裁"俘獲"玩家芳心

房產要聞

利潤暴跌44%!那個春節被罵慘了的海峽股份 正在經歷什么?

藝術要聞

龐茂琨 2026油畫寫生新作

親子要聞

家庭聚會了

軍事要聞

黎真主黨發射火箭彈 回應以違反停火協議

無障礙瀏覽 進入關懷版