![]()
整理 | 屠敏
出品 | CSDN(ID:CSDNnews)
上周,在全球最大的大模型 API 聚合平臺 OpenRouter 上,一款代號為 Hunter Alpha 的神秘模型調用量一路飆升至榜首,迅速成為圈內熱議的焦點。
![]()
在外界還在猜測這個“幕后玩家”究竟是誰時,答案很快揭曉——今天,小米正式出面認領,并發布了這款模型的真實身份:MiMo-V2-Pro。此外,其還推出了相關系列模型MiMo-V2-Omni 和 TTS。
這款模型一亮相就直接把關注度拉滿:萬億參數規模,性能對標 GPT-5.2 和 Claude Opus 4.6,而通過自有 API 調用的成本卻壓到對手的約六分之一到七分之一。
此項目由小米 AI 實驗室大模型團隊負責人、前 DeepSeek R1 核心成員羅福莉領銜,她將這次發布形容為一次“悄無聲息的伏擊”。
隨即,雷軍也在微博發文確認,小米上周在 OpenRouter 匿名發布的 MiMo?V2?Pro 不僅快速登頂日榜,如今更是成為周榜第一。
![]()
![]()
MiMo?V2?Pro 登場,直接生成
很多人對大模型的印象,還停留在陪人聊天、寫文案、答問題。但 MiMo?V2?Pro 從設計之初就走向了另一條路徑。
它的能力不再局限于“回答問題”、“生成 Demo”,而是被打造為 Agent 時代的執行中樞。換句話說,它更像復雜系統的“中央大腦”,可以直接參與代碼生成、終端執行、長流程任務規劃,甚至多智能體協同與企業級知識處理。
在羅福莉的描述中,這是“小米首個真正為 Agent 時代構建的全棧模型體系”。
小米對它的定位也很明確:不只是工具,而是要成為驅動各類系統與工作流的底層核心,在真實生產環境中持續產生價值。
此次發布之際,小米也曬出了 MiMo-V2-Pro 的一些成果,其已經不只是“能生成代碼”,而是更接近“直接交付成品”。
譬如讓 MiMo-V2-Pro 用 Three.js 或 Babylon.js 開發一款 3D 塔防游戲,得到的結果如下:
此外,當模型被要求復刻一種帶有 1990 年代印刷雜志風格的網頁設計:標題使用襯線字體,正文采用等寬字體,整體采用多欄排版,版式還刻意帶有不對稱結構和“出血”效果;圖片帶有褐色濾鏡與顆粒噪點,頁面切換模擬翻頁效果;導航被設計成類似雜志目錄的樣式,每一項帶編號并在懸停時放大;底部則還原為類似“出版信息”的版塊,甚至包含虛構的 ISSN 號。
在這樣的復雜提示下,MiMo-V2-Pro 能夠一次性生成結構完整、風格統一的網頁,而不僅僅是零散片段,整體更接近可直接使用的成品。
![]()
萬億參數模型揭曉
不過,“智能體時代”的核心挑戰,是在海量數據范圍內保持高保真的推理能力,同時避免因延遲或成本帶來的“智能稅”。
根據官方介紹,MiMo-V2-Pro 通過稀疏架構來應對這一問題。雖然該模型的總參數達到 1 萬億,但在實際運行時,單次僅激活 420 億參數,規模約為 MiMo-V2-Flash 的 3 倍。
底層架構設計上,其效率來自進化后的混合注意力機制。傳統 Transformer 在上下文增長時計算復雜度呈平方級上升,而 MiMo-V2-Pro 采用 7:1 的混合比例(較 Flash 版本的 5:1 有所提升),來管理高達 100 萬 token 的上下文窗口。
這一設計讓模型在處理長時任務時依然能夠保持“深度記憶”,而不會出現性能明顯下降。
此外,模型還結合了輕量級的 MTP 多 token 預測層,使其能夠同時預測多個 token,大幅降低智能體工作流中“思考階段”的延遲。
羅福莉表示,這些結構性設計早在數月前就已確定,目的是在行業突然轉向智能體時獲得“結構性優勢”。
![]()
MiMo-V2-Pro 位列全球第八,國內第二
在具體性能表現維度,根據小米官方分享的基準測試結果顯示,MiMo-V2-Pro 在主流智能體基準測試中表現出色。其編碼能力超越了 Claude 4.6 Sonnet,通用智能體性能(ClawEval)接近 Opus 4.6。工具調用穩定性和準確率也得到了顯著提升。
![]()
此外,據第三方機構 Artificial Analysis 的評測顯示,MiMo-V2-Pro 拿下全球第八,國內第二的好成績。
從細分維度來看:
? MiMo-V2-Pro 在 Artificial Analysis 智能指數中得分 49,僅次于 GLM-5(推理版,50 分),高于 Kimi K2.5(47 分)和 Qwen3.5 397B A17B(45 分)。在綜合榜單中排名第 10,位于 GPT-5.2 Codex(49 分)之后、Grok 4.20 Beta(48 分)之前。
? 在 GDPval-AA(面向真實世界任務的智能體基準)中,MiMo-V2-Pro 以 1426 Elo 領先同類模型,包括 GLM-5(1406)、Kimi K2.5(1283)和 Qwen3.5 397B A17B(1209)。相比之下,GPT-5.4 和 Claude Sonnet 4.6 的 Elo 分別為 1667 和 1633。
? 憑借較低的幻覺率,MiMo-V2-Pro 在 AA 全知指數(Omniscience Index)中獲得 +5,領先 GLM-5(+2)、Kimi K2.5(-8)和 Qwen3.5(-30)。不過,Claude Opus 4.6(+14)和 Gemini 3.1 Pro Preview(+33)仍然更高。
? 在 token 使用效率方面,MiMo-V2-Pro 更加精簡:完成整套評測僅使用 7700 萬輸出 token,顯著低于 GLM-5(1.09 億)和 Kimi K2.5(8900 萬)。
![]()
如果說接近第一梯隊的性能是驚喜,那么同樣讓人驚訝的還有它的成本。
![]()
成本僅為主流競品的六分之一到七分之一
Artificial Analysis 實測數據顯示,MiMo-V2-Pro 運行整套智能指數測試僅需 348 美元(按輸入 $1 / 輸出 $3 每百萬 token 計費)。
盡管得分僅比 GLM-5 低 1 分,但成本更低。
相比之下,GPT-5.2 約為 2304 美元,Claude Opus 4.6 約為 2486 美元。同樣的任務,小米模型的成本僅為這些主流競品的六分之一到七分之一。
與此同時,小米為 MiMo-V2-Pro 制定了極具攻擊性的定價策略:
MiMo-V2-Pro(≤256K):每百萬輸入 tokens 1 美元,每百萬輸出 tokens 3 美元
MiMo-V2-Pro(256K–1M):每百萬輸入 tokens 2 美元,每百萬輸出 tokens 6 美元
緩存讀取(Cache read):低檔為每百萬 tokens 0.20 美元,高檔為每百萬 tokens 0.40 美元
緩存寫入(Cache write):暫時免費(0 美元)
相較其他領先前沿模型,小米的這種定價策略,也直接打破了“頂級大模型=極高成本”的行業慣例,讓中小企業、普通開發者都能用上接近 GPT?5.2 水平的 AI 能力。顯然,小米的這一策略明顯意在搶占開發者市場,推動高強度應用場景的落地。
![]()
![]()
羅福莉揭曉MiMo?V2?Pro 落地的背后思考
MiMo?V2?Pro 的橫空出世,離不開核心負責人羅福莉。
對于這次發布,羅福莉也在 X 平臺上分享了這款新模型訓練的過程與自己的思考,她表示:
「這個萬億參數的基礎模型幾個月前就已經啟動訓練,最初的目標是提升長上下文推理效率。Hybrid Attention 帶來了真正的創新,但又不過度激進,結果證明它恰好成為 Agent 時代的理想基礎:支持 100 萬上下文窗口,結合 MTP 推理實現超低延遲與成本。這些架構選擇并不是追逐熱點,而是我們在需求真正爆發前就構建好的“結構性優勢”。
真正改變一切的,是第一次體驗復雜的 agentic scaffold——我更愿意稱之為“編排后的上下文”(orchestrated context)。那一刻非常震撼。第一天我就試圖說服團隊去用,但沒人買賬。于是我下了一個硬性要求:MiMo 團隊里,如果第二天對話數少于 100 次,可以直接離開。結果證明,這一招奏效了。一旦團隊真正理解了 Agent 系統的潛力,這種想象力就會直接轉化為研究速度。
很多人問我們為什么能推進這么快。我在做 DeepSeek R1 時就親身經歷過,可以簡單總結為:
—基礎模型和基礎設施研究周期很長,需要在一年前就建立戰略判斷
— 后訓練階段則完全不同,更依賴產品直覺驅動評估,迭代節奏更快,也更容易捕捉范式變化
— 而始終不變的,是好奇心、敏銳的技術直覺、果斷執行、全情投入,以及一個常被低估的因素:對你正在構建的世界發自內心的熱愛
我們會開源——等模型足夠穩定、真正“配得上”開源的時候。」
![]()
![]()
雷軍:Mimo-V2-Pro超過了 xAI Grok
在模型推出的第一時間,雷軍也親自站臺發文慶賀道:“在全球大模型綜合智能排行榜 Artificial Analysis 上,Mimo-V2-Pro 位列全球第八。按大模型品牌來排名,排在全球第五,超過了 xAI Grok。我們模型剛剛完成,未來一段時間,還會快速迭代增強。小米在 AI 領域上相對比較低調,實際進展可能比大家看到的要快很多。”
同時他還透露,在 AI 領域,小米今年的研發和資本投入就將超過 160 億元。
![]()
對全球 AI 行業而言,小米發布 MiMo?V2?Pro,遠不止是推出一款新模型,它更像一個信號:AI 正在從“會說話”,走向“能做事”。
從性能到成本,從架構到定位,小米試圖回答一個更本質的問題——在智能體時代,模型到底應該如何參與世界?
而 MiMo-V2-Pro,只是這個方向的起點。如果說過去的競爭是“誰更會對話”,那么接下來的競爭,可能會變成——誰更能行動。
https://mimo.xiaomi.com/mimo-v2-pro
https://weibo.com/u/1749127163
https://x.com/_LuoFuli/status/2034379957913129140
https://x.com/ArtificialAnlys/status/2034239267052896516
https://venturebeat.com/technology/xiaomi-stuns-with-new-mimo-v2-pro-llm-nearing-gpt-5-2-opus-4-6-performance
【活動分享】“48 小時,與 50+ 位大廠技術決策者,共探 AI 落地真路徑。”由 CSDN 與奇點智能研究院聯合舉辦的「全球機器學習技術大會」正式升級為「奇點智能技術大會」。2026 奇點智能技術大會將于 4 月 17-18 日在上海環球港凱悅酒店正式召開,大會聚焦大模型技術演進、智能體系統工程、OpenClaw 生態實踐及 AI 行業落地等十二大專題板塊,特邀來自BAT、京東、微軟、小紅書、美團等頭部企業的 50+ 位技術決策者分享實戰案例。這不僅是一場技術的盛宴,更是決策者把握 2026 AI 拐點的戰略機會。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.