337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

雷軍的AI福將?羅福莉交出萬(wàn)億參數(shù)模型大作業(yè),林俊旸點(diǎn)贊

0
分享至



出品|搜狐科技

作者|常博碩

編輯| 楊 錦

真相大白了,Hunter Alpha原來(lái)是小米羅福莉的“作業(yè)”。

事情還要回溯到3月11日,當(dāng)天全球最大API聚合平臺(tái)OpenRouter上突然出現(xiàn)了一個(gè)代號(hào)為Hunter Alpha的模型。短短七天內(nèi),累計(jì)調(diào)用量突破1萬(wàn)億Token,連續(xù)多日登頂榜單。


這個(gè)模型沒(méi)有標(biāo)注開(kāi)發(fā)者身份,于3月11日以“隱身模型”形式發(fā)布,且向開(kāi)發(fā)者提供免費(fèi)訪問(wèn)。測(cè)試顯示,該系統(tǒng)具備1萬(wàn)億參數(shù)規(guī)模和高達(dá)100萬(wàn)token的上下文窗口。

由于模型自稱(chēng)是主要以中文訓(xùn)練的中國(guó)AI模型,知識(shí)截止時(shí)間為2025年5月,不管是性能參數(shù)還是知識(shí)時(shí)間節(jié)點(diǎn)都和DeepSeek之前的模型風(fēng)格很相似,于是市場(chǎng)便紛紛猜測(cè)這可能是DeepSeek在正式發(fā)布前對(duì)其下一代系統(tǒng)進(jìn)行的秘密測(cè)試。

然而,昨天小米 MiMo 團(tuán)隊(duì)正式認(rèn)領(lǐng)了該模型,Hunter Alpha是小米旗艦?zāi)P蚆iMo-V2-Pro的內(nèi)部測(cè)試版本。目前,小米AI團(tuán)隊(duì)領(lǐng)軍人物是前DeepSeek 核心研究員羅福莉,或許這也是為什么Hunter Alpha會(huì)讓大家“幻視”DeepSeek吧。


小米也想上桌

在小米新品發(fā)布會(huì)上,雷軍正式發(fā)布小米首款自研旗艦大模型Xiaomi MiMo-V2-Pro,此外,小米還推出了相關(guān)系列模型MiMo-V2-Omni 和 TTS。

過(guò)去一年,小米在AI領(lǐng)域的存在感并不強(qiáng)。既沒(méi)有阿里那樣做基模也不像DeepSeek 在社區(qū)靠開(kāi)源爆火,更像是硬件和生態(tài)玩家。但這次Hunter Alpha的表現(xiàn)直接說(shuō)明,小米已經(jīng)擁有一支能做萬(wàn)億級(jí)模型的團(tuán)隊(duì)。

此次小米共發(fā)布三款模型,MiMo-V2-Pro(原Hunter Alpha)是一款面向Agent時(shí)代的旗艦基座模型??倕?shù)量1萬(wàn)億,激活參數(shù)控制在42B,并支持1M超長(zhǎng)上下文。

MiMo-V2-Omni(原Healer Alpha):全模態(tài)理解模型。專(zhuān)為需要快速反應(yīng)和低延遲的真實(shí)場(chǎng)景打造,能夠同時(shí)處理文本、圖像、音頻乃至長(zhǎng)達(dá)一小時(shí)的視頻輸入。

MiMo-V2-TTS則是一款擬人語(yǔ)音大模型。

具體來(lái)看,MiMo-V2-Pro是此次受關(guān)注最高的一款模型,也是小米正式進(jìn)軍智能體時(shí)代的標(biāo)志。與傳統(tǒng)以對(duì)話體驗(yàn)為核心優(yōu)化目標(biāo)的語(yǔ)言模型不同,它的設(shè)計(jì)起點(diǎn)并非“生成回答”,而是作為 Agent 系統(tǒng)的中樞,能夠理解目標(biāo)、規(guī)劃步驟、調(diào)用外部工具,并在多階段執(zhí)行過(guò)程中持續(xù)修正路徑,最終完成任務(wù)閉環(huán)。

從模型架構(gòu)來(lái)看,MiMo-V2-Pro 采用超大規(guī)模稀疏化設(shè)計(jì),總參數(shù)規(guī)模達(dá)到萬(wàn)億級(jí)(1T),其中單次推理的激活參數(shù)約為 42B。

這一結(jié)構(gòu)本質(zhì)上是對(duì) MoE(Mixture-of-Experts)體系的進(jìn)一步工程化實(shí)現(xiàn),大規(guī)模專(zhuān)家網(wǎng)絡(luò)承載知識(shí)容量,同時(shí)在推理階段僅激活部分子網(wǎng)絡(luò),這就能夠在不增加計(jì)算成本的情況下擴(kuò)展模型表達(dá)能力。

在注意力機(jī)制上,MiMo-V2-Pro 引入改進(jìn)后的路由注意力(Hybrid Attention)結(jié)構(gòu),將局部窗口注意力與全局注意力進(jìn)行分層組合。通過(guò)窗口化機(jī)制限制計(jì)算復(fù)雜度的同時(shí)還能通過(guò)全局路徑保留長(zhǎng)距離依賴。

這就使得模型能夠在長(zhǎng)上下文場(chǎng)景下維持穩(wěn)定推理,不會(huì)出現(xiàn)典型的注意力退化問(wèn)題。

MiMo-V2-Pro的上下文窗口進(jìn)一步擴(kuò)展至100萬(wàn)Token。在多步驟任務(wù)執(zhí)行中,模型可以在單次上下文內(nèi)保留完整的中間狀態(tài)、工具調(diào)用結(jié)果以及歷史決策路徑,從而避免頻繁的上下文重建或外部檢索。這一特性對(duì)于Agent系統(tǒng)尤為關(guān)鍵,使其能夠在長(zhǎng)鏈路任務(wù)中保持一致性與連貫性。

在此前以Hunter Alpha代號(hào)進(jìn)行的匿名測(cè)試階段,這些能力已經(jīng)有所體現(xiàn)。根據(jù)OpenRouter官網(wǎng)的調(diào)用數(shù)據(jù),模型在上線后使用場(chǎng)景更多是代碼生成、開(kāi)發(fā)工具與自動(dòng)化任務(wù)。

從跑分上來(lái)看,MiMo-V2-Pro表現(xiàn)確實(shí)很不錯(cuò)。

在通用Agent能力評(píng)估(ClawEval)中,MiMo-V2-Pro得分61.5,逼近Claude Opus 4.6;在PinchBench測(cè)試中排名全球前三。在編碼能力方面,其表現(xiàn)甚至超過(guò)Claude Sonnet 4.6,接近更高端的Opus級(jí)別。

定價(jià)上,MiMo-V2-Pro在256K上下文長(zhǎng)度內(nèi),輸入token單價(jià)為每百萬(wàn)1美元,輸出為每百萬(wàn)3美元;即使擴(kuò)展到100萬(wàn)上下文,輸入也只需每百萬(wàn)2美元,輸出每百萬(wàn)6美元,價(jià)格約Claude Opus 4.6的五分之一。


林俊旸點(diǎn)贊羅福莉

羅福莉,是這次 MiMo 模型體系中一個(gè)繞不開(kāi)的關(guān)鍵人物。她本科畢業(yè)于北京師范大學(xué)計(jì)算機(jī)專(zhuān)業(yè),碩士畢業(yè)于北京大學(xué)計(jì)算語(yǔ)言學(xué)研究所。曾任職于阿里巴巴達(dá)摩院、幻方量化及DeepSeek(深度求索)。

在阿里期間,她主導(dǎo)開(kāi)發(fā)了多語(yǔ)言預(yù)訓(xùn)練模型VECO;在DeepSeek期間,她是MoE大模型DeepSeek-V2的關(guān)鍵開(kāi)發(fā)者之一。2025年11月,羅福莉加入小米,負(fù)責(zé)領(lǐng)導(dǎo)MiMo大模型團(tuán)隊(duì)。

這次的MiMo-V2-Pro,是羅福莉加入小米后交的第一份大作業(yè)。

在模型公布后,她在自己的社交主頁(yè)寫(xiě)道:MiMo-V2-Pro、Omni 和 TTS 正式發(fā)布。這是我們首個(gè)真正為智能體時(shí)代打造的全棧模型系列。我稱(chēng)之為一次悄無(wú)聲息的突襲——并非因?yàn)槲覀兪孪扔?jì)劃好的,而是因?yàn)閺牧奶炷J降街悄荏w模式的轉(zhuǎn)變發(fā)生得太快,連我們自己都難以置信。在這期間,我們經(jīng)歷了一個(gè)既激動(dòng)人心又痛苦不堪,同時(shí)又令人著迷的過(guò)程。

據(jù)羅福莉表示,1T 基礎(chǔ)模型早在幾個(gè)月前就開(kāi)始訓(xùn)練了。最初的目標(biāo)是提高長(zhǎng)上下文推理的效率?;旌献⒁饬C(jī)制帶來(lái)了真正的創(chuàng)新,卻又不至于過(guò)度擴(kuò)張。事實(shí)證明,它正是智能體時(shí)代的理想基礎(chǔ)。1M 的上下文窗口。MTP 推理技術(shù)實(shí)現(xiàn)了超低延遲和成本。這些架構(gòu)決策并非一時(shí)風(fēng)尚,而是我們?cè)谛枰熬蜆?gòu)建的結(jié)構(gòu)性優(yōu)勢(shì)。真正改變一切的是第一次體驗(yàn)到復(fù)雜的智能體框架。

她還透露,自己給團(tuán)隊(duì)下了硬性指標(biāo):MiMo團(tuán)隊(duì)中,每天與AI對(duì)話少于100次的人都可以辭職。

在羅福莉看來(lái),一旦團(tuán)隊(duì)的想象力被智能系統(tǒng)的功能所激發(fā),這種想象力就直接轉(zhuǎn)化為研發(fā)速度。

她還透露,當(dāng)模型足夠穩(wěn)定值得開(kāi)源的時(shí)候,她會(huì)選擇開(kāi)源。隨后,前阿里巴巴通義千問(wèn)(Qwen)系列大模型核心技術(shù)負(fù)責(zé)人林俊旸點(diǎn)贊了該帖,并評(píng)論道:“太棒了?!?/p>


模型發(fā)布后,雷軍第一時(shí)間表示,“我們剛發(fā)布萬(wàn)億參數(shù)大模型 Mimo-V2-Pro。在全球大模型綜合智能排行榜 Artificial Analysis 上,位列全球第八。按大模型品牌來(lái)排名,排在全球第五,超過(guò)了xAI Grok。我們模型剛剛完成,未來(lái)一段時(shí)間,還會(huì)快速迭代增強(qiáng)?!?/p>

同時(shí)他也承認(rèn),小米一直以來(lái)在AI領(lǐng)域相對(duì)比較低調(diào),實(shí)際進(jìn)展可能比大家看到的要快很多。

對(duì)于進(jìn)軍AI這件事,雷軍并不吝嗇,他表示:“我們今年的研發(fā)和資本投入就將超過(guò)160億元。我相信,只要我們堅(jiān)持持續(xù)投入,小米在AI時(shí)代一定會(huì)交出一份靚麗的答卷。”



運(yùn)營(yíng)編輯 |曹倩審核|孟莎莎




特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗被曝拒絕與威特科夫和庫(kù)什納談判

伊朗被曝拒絕與威特科夫和庫(kù)什納談判

新華社
2026-03-25 11:08:02
曝張雪峰已經(jīng)二婚,11歲女兒繼承遺產(chǎn)變復(fù)雜,處境令人心疼!

曝張雪峰已經(jīng)二婚,11歲女兒繼承遺產(chǎn)變復(fù)雜,處境令人心疼!

古希臘掌管松餅的神
2026-03-24 23:29:16
遲遲都等不到中企復(fù)工,巴拿馬頭號(hào)幫手已介入,中方加強(qiáng)港口管制

遲遲都等不到中企復(fù)工,巴拿馬頭號(hào)幫手已介入,中方加強(qiáng)港口管制

奧字侃劇
2026-03-25 08:29:10
皇馬草臺(tái)班子!確認(rèn)姆巴佩遭誤診,隊(duì)醫(yī)用免費(fèi)版AI給球員推薦補(bǔ)劑

皇馬草臺(tái)班子!確認(rèn)姆巴佩遭誤診,隊(duì)醫(yī)用免費(fèi)版AI給球員推薦補(bǔ)劑

小金體壇大視野
2026-03-25 09:28:01
寫(xiě)小說(shuō)判十年,把生殖器放女孩嘴巴里判兩年九個(gè)月

寫(xiě)小說(shuō)判十年,把生殖器放女孩嘴巴里判兩年九個(gè)月

昊軒看世界
2026-03-24 19:56:42
馮怡任浙江省委常委、統(tǒng)戰(zhàn)部部長(zhǎng)

馮怡任浙江省委常委、統(tǒng)戰(zhàn)部部長(zhǎng)

中國(guó)經(jīng)濟(jì)網(wǎng)
2026-03-25 09:28:09
志愿者秦嶺撿垃圾被推后續(xù):兩男子身份曝光,工作不保,警方介入

志愿者秦嶺撿垃圾被推后續(xù):兩男子身份曝光,工作不保,警方介入

奇思妙想草葉君
2026-03-24 16:34:42
上海多位富婆為他心甘情愿掏了1500萬(wàn)!一個(gè)混混推拿師,怎么做到的?

上海多位富婆為他心甘情愿掏了1500萬(wàn)!一個(gè)混混推拿師,怎么做到的?

上觀新聞
2026-03-24 20:43:11
伊朗被美以單方面轟炸23天,為何革命衛(wèi)隊(duì)依舊不認(rèn)輸?

伊朗被美以單方面轟炸23天,為何革命衛(wèi)隊(duì)依舊不認(rèn)輸?

高博新視野
2026-03-24 08:00:16
張雪峰去世,曾言:“如果有一天我死了,各大平臺(tái)會(huì)有一個(gè)熱搜,希望能成為一代人的回憶”

張雪峰去世,曾言:“如果有一天我死了,各大平臺(tái)會(huì)有一個(gè)熱搜,希望能成為一代人的回憶”

神奇故事
2026-03-24 22:38:02
高鐵站臺(tái)能否全面禁煙?12306回應(yīng)

高鐵站臺(tái)能否全面禁煙?12306回應(yīng)

中國(guó)新聞周刊
2026-03-24 20:43:03
張雪峰去世后續(xù),二婚妻子發(fā)聲緬懷,兩人結(jié)婚證被扒!

張雪峰去世后續(xù),二婚妻子發(fā)聲緬懷,兩人結(jié)婚證被扒!

古希臘掌管松餅的神
2026-03-25 10:02:28
小愈AI陪伴機(jī)器人,替你照看父母,讓愛(ài),成為家庭的“常駐人口”

小愈AI陪伴機(jī)器人,替你照看父母,讓愛(ài),成為家庭的“常駐人口”

揣著夢(mèng)想出發(fā)
2026-03-25 09:28:39
人民銳評(píng):國(guó)際油價(jià)飆升,中國(guó)為何穩(wěn)得???

人民銳評(píng):國(guó)際油價(jià)飆升,中國(guó)為何穩(wěn)得住?

澎湃新聞
2026-03-24 14:57:02
人民網(wǎng)剛批完姚晨,就被網(wǎng)友們發(fā)現(xiàn)它又在雙標(biāo)了

人民網(wǎng)剛批完姚晨,就被網(wǎng)友們發(fā)現(xiàn)它又在雙標(biāo)了

清書(shū)先生
2026-03-24 16:59:21
張雪峰和二婚老婆付幸的甜蜜合照曝光,兩人是同事,新婚不到一年

張雪峰和二婚老婆付幸的甜蜜合照曝光,兩人是同事,新婚不到一年

樂(lè)天閑聊
2026-03-25 09:04:11
初代丑男何潤(rùn)東的突然爆火,狠狠抽了內(nèi)娛一巴掌

初代丑男何潤(rùn)東的突然爆火,狠狠抽了內(nèi)娛一巴掌

娛樂(lè)圈筆娛君
2026-03-24 16:08:36
中山火炬集團(tuán)有限公司原董事長(zhǎng)張朗生被查

中山火炬集團(tuán)有限公司原董事長(zhǎng)張朗生被查

界面新聞
2026-03-25 10:21:59
伊朗還能“憑導(dǎo)彈再扛四個(gè)月”?美國(guó)有意停戰(zhàn),以色列慌了……

伊朗還能“憑導(dǎo)彈再扛四個(gè)月”?美國(guó)有意停戰(zhàn),以色列慌了……

上觀新聞
2026-03-25 11:34:06
張雪峰傳奇人生揭秘:父母下崗,大學(xué)考上鄭大,第一份工作開(kāi)飯店

張雪峰傳奇人生揭秘:父母下崗,大學(xué)考上鄭大,第一份工作開(kāi)飯店

談史論天地
2026-03-25 07:26:54
2026-03-25 12:48:49
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方賬號(hào)
4741文章數(shù) 9183關(guān)注度
往期回顧 全部

科技要聞

紅極一時(shí)卻草草收?qǐng)觯琒ora宣布正式關(guān)停

頭條要聞

伊朗被指可"憑導(dǎo)彈再扛四個(gè)月" 美國(guó)想停戰(zhàn)以色列慌了

頭條要聞

伊朗被指可"憑導(dǎo)彈再扛四個(gè)月" 美國(guó)想停戰(zhàn)以色列慌了

體育要聞

NBA最強(qiáng)左手射手,是個(gè)右撇子

娛樂(lè)要聞

張雪峰經(jīng)搶救無(wú)效不幸去世 年僅41歲

財(cái)經(jīng)要聞

張雪峰:寒門(mén)講師的商業(yè)躍遷

汽車(chē)要聞

智己LS8放大招 30萬(wàn)內(nèi)8系旗艦+全線控底盤(pán)秀實(shí)力

態(tài)度原創(chuàng)

房產(chǎn)
旅游
本地
公開(kāi)課
軍事航空

房產(chǎn)要聞

北上廣深二手房集體回暖!三月小陽(yáng)春行情全面兌現(xiàn)

旅游要聞

來(lái)崇明挖呀挖呀挖

本地新聞

來(lái)永泰同安 赴一場(chǎng)春天的約會(huì)

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

以色列媒體:美國(guó)計(jì)劃于4月9日結(jié)束對(duì)伊朗戰(zhàn)爭(zhēng)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版