網易首頁 > 網易號 > 正文申請入駐

小米深夜認領榜一神秘大模型，MiMo-V2-Pro重磅發布！雷軍直言：已超馬斯克的Grok

2026-03-19 20:31:18　來源: CSDN

北京舉報

分享至

整理 | 屠敏

出品 | CSDN（ID：CSDNnews）

上周，在全球最大的大模型 API 聚合平臺 OpenRouter 上，一款代號為 Hunter Alpha 的神秘模型調用量一路飆升至榜首，迅速成為圈內熱議的焦點。

在外界還在猜測這個“幕后玩家”究竟是誰時，答案很快揭曉——今天，小米正式出面認領，并發布了這款模型的真實身份：MiMo-V2-Pro。此外，其還推出了相關系列模型MiMo-V2-Omni 和 TTS。

這款模型一亮相就直接把關注度拉滿：萬億參數規模，性能對標 GPT-5.2 和 Claude Opus 4.6，而通過自有 API 調用的成本卻壓到對手的約六分之一到七分之一。

此項目由小米 AI 實驗室大模型團隊負責人、前 DeepSeek R1 核心成員羅福莉領銜，她將這次發布形容為一次“悄無聲息的伏擊”。

隨即，雷軍也在微博發文確認，小米上周在 OpenRouter 匿名發布的 MiMo?V2?Pro 不僅快速登頂日榜，如今更是成為周榜第一。

MiMo?V2?Pro 登場，直接生成

很多人對大模型的印象，還停留在陪人聊天、寫文案、答問題。但 MiMo?V2?Pro 從設計之初就走向了另一條路徑。

它的能力不再局限于“回答問題”、“生成 Demo”，而是被打造為 Agent 時代的執行中樞。換句話說，它更像復雜系統的“中央大腦”，可以直接參與代碼生成、終端執行、長流程任務規劃，甚至多智能體協同與企業級知識處理。

在羅福莉的描述中，這是“小米首個真正為 Agent 時代構建的全棧模型體系”。

小米對它的定位也很明確：不只是工具，而是要成為驅動各類系統與工作流的底層核心，在真實生產環境中持續產生價值。

此次發布之際，小米也曬出了 MiMo-V2-Pro 的一些成果，其已經不只是“能生成代碼”，而是更接近“直接交付成品”。

譬如讓 MiMo-V2-Pro 用 Three.js 或 Babylon.js 開發一款 3D 塔防游戲，得到的結果如下：

此外，當模型被要求復刻一種帶有 1990 年代印刷雜志風格的網頁設計：標題使用襯線字體，正文采用等寬字體，整體采用多欄排版，版式還刻意帶有不對稱結構和“出血”效果；圖片帶有褐色濾鏡與顆粒噪點，頁面切換模擬翻頁效果；導航被設計成類似雜志目錄的樣式，每一項帶編號并在懸停時放大；底部則還原為類似“出版信息”的版塊，甚至包含虛構的 ISSN 號。

在這樣的復雜提示下，MiMo-V2-Pro 能夠一次性生成結構完整、風格統一的網頁，而不僅僅是零散片段，整體更接近可直接使用的成品。

萬億參數模型揭曉

不過，“智能體時代”的核心挑戰，是在海量數據范圍內保持高保真的推理能力，同時避免因延遲或成本帶來的“智能稅”。

根據官方介紹，MiMo-V2-Pro 通過稀疏架構來應對這一問題。雖然該模型的總參數達到 1 萬億，但在實際運行時，單次僅激活 420 億參數，規模約為 MiMo-V2-Flash 的 3 倍。

底層架構設計上，其效率來自進化后的混合注意力機制。傳統 Transformer 在上下文增長時計算復雜度呈平方級上升，而 MiMo-V2-Pro 采用 7:1 的混合比例（較 Flash 版本的 5:1 有所提升），來管理高達 100 萬 token 的上下文窗口。

這一設計讓模型在處理長時任務時依然能夠保持“深度記憶”，而不會出現性能明顯下降。

此外，模型還結合了輕量級的 MTP 多 token 預測層，使其能夠同時預測多個 token，大幅降低智能體工作流中“思考階段”的延遲。

羅福莉表示，這些結構性設計早在數月前就已確定，目的是在行業突然轉向智能體時獲得“結構性優勢”。

MiMo-V2-Pro 位列全球第八，國內第二

在具體性能表現維度，根據小米官方分享的基準測試結果顯示，MiMo-V2-Pro 在主流智能體基準測試中表現出色。其編碼能力超越了 Claude 4.6 Sonnet，通用智能體性能（ClawEval）接近 Opus 4.6。工具調用穩定性和準確率也得到了顯著提升。

此外，據第三方機構 Artificial Analysis 的評測顯示，MiMo-V2-Pro 拿下全球第八，國內第二的好成績。

從細分維度來看：

? MiMo-V2-Pro 在 Artificial Analysis 智能指數中得分 49，僅次于 GLM-5（推理版，50 分），高于 Kimi K2.5（47 分）和 Qwen3.5 397B A17B（45 分）。在綜合榜單中排名第 10，位于 GPT-5.2 Codex（49 分）之后、Grok 4.20 Beta（48 分）之前。

? 在 GDPval-AA（面向真實世界任務的智能體基準）中，MiMo-V2-Pro 以 1426 Elo 領先同類模型，包括 GLM-5（1406）、Kimi K2.5（1283）和 Qwen3.5 397B A17B（1209）。相比之下，GPT-5.4 和 Claude Sonnet 4.6 的 Elo 分別為 1667 和 1633。

? 憑借較低的幻覺率，MiMo-V2-Pro 在 AA 全知指數（Omniscience Index）中獲得 +5，領先 GLM-5（+2）、Kimi K2.5（-8）和 Qwen3.5（-30）。不過，Claude Opus 4.6（+14）和 Gemini 3.1 Pro Preview（+33）仍然更高。

? 在 token 使用效率方面，MiMo-V2-Pro 更加精簡：完成整套評測僅使用 7700 萬輸出 token，顯著低于 GLM-5（1.09 億）和 Kimi K2.5（8900 萬）。

如果說接近第一梯隊的性能是驚喜，那么同樣讓人驚訝的還有它的成本。

成本僅為主流競品的六分之一到七分之一

Artificial Analysis 實測數據顯示，MiMo-V2-Pro 運行整套智能指數測試僅需 348 美元（按輸入 $1 / 輸出 $3 每百萬 token 計費）。

盡管得分僅比 GLM-5 低 1 分，但成本更低。

相比之下，GPT-5.2 約為 2304 美元，Claude Opus 4.6 約為 2486 美元。同樣的任務，小米模型的成本僅為這些主流競品的六分之一到七分之一。

與此同時，小米為 MiMo-V2-Pro 制定了極具攻擊性的定價策略：

MiMo-V2-Pro（≤256K）：每百萬輸入 tokens 1 美元，每百萬輸出 tokens 3 美元
MiMo-V2-Pro（256K–1M）：每百萬輸入 tokens 2 美元，每百萬輸出 tokens 6 美元
緩存讀取（Cache read）：低檔為每百萬 tokens 0.20 美元，高檔為每百萬 tokens 0.40 美元
緩存寫入（Cache write）：暫時免費（0 美元）

相較其他領先前沿模型，小米的這種定價策略，也直接打破了“頂級大模型=極高成本”的行業慣例，讓中小企業、普通開發者都能用上接近 GPT?5.2 水平的 AI 能力。顯然，小米的這一策略明顯意在搶占開發者市場，推動高強度應用場景的落地。

羅福莉揭曉MiMo?V2?Pro 落地的背后思考

MiMo?V2?Pro 的橫空出世，離不開核心負責人羅福莉。

對于這次發布，羅福莉也在 X 平臺上分享了這款新模型訓練的過程與自己的思考，她表示：

「這個萬億參數的基礎模型幾個月前就已經啟動訓練，最初的目標是提升長上下文推理效率。Hybrid Attention 帶來了真正的創新，但又不過度激進，結果證明它恰好成為 Agent 時代的理想基礎：支持 100 萬上下文窗口，結合 MTP 推理實現超低延遲與成本。這些架構選擇并不是追逐熱點，而是我們在需求真正爆發前就構建好的“結構性優勢”。

真正改變一切的，是第一次體驗復雜的 agentic scaffold——我更愿意稱之為“編排后的上下文”（orchestrated context）。那一刻非常震撼。第一天我就試圖說服團隊去用，但沒人買賬。于是我下了一個硬性要求：MiMo 團隊里，如果第二天對話數少于 100 次，可以直接離開。結果證明，這一招奏效了。一旦團隊真正理解了 Agent 系統的潛力，這種想象力就會直接轉化為研究速度。

很多人問我們為什么能推進這么快。我在做 DeepSeek R1 時就親身經歷過，可以簡單總結為：

—基礎模型和基礎設施研究周期很長，需要在一年前就建立戰略判斷

— 后訓練階段則完全不同，更依賴產品直覺驅動評估，迭代節奏更快，也更容易捕捉范式變化

— 而始終不變的，是好奇心、敏銳的技術直覺、果斷執行、全情投入，以及一個常被低估的因素：對你正在構建的世界發自內心的熱愛

我們會開源——等模型足夠穩定、真正“配得上”開源的時候。」

雷軍：Mimo-V2-Pro超過了 xAI Grok

在模型推出的第一時間，雷軍也親自站臺發文慶賀道：“在全球大模型綜合智能排行榜 Artificial Analysis 上，Mimo-V2-Pro 位列全球第八。按大模型品牌來排名，排在全球第五，超過了 xAI Grok。我們模型剛剛完成，未來一段時間，還會快速迭代增強。小米在 AI 領域上相對比較低調，實際進展可能比大家看到的要快很多。”

同時他還透露，在 AI 領域，小米今年的研發和資本投入就將超過 160 億元。

對全球 AI 行業而言，小米發布 MiMo?V2?Pro，遠不止是推出一款新模型，它更像一個信號：AI 正在從“會說話”，走向“能做事”。

從性能到成本，從架構到定位，小米試圖回答一個更本質的問題——在智能體時代，模型到底應該如何參與世界？

而 MiMo-V2-Pro，只是這個方向的起點。如果說過去的競爭是“誰更會對話”，那么接下來的競爭，可能會變成——誰更能行動。

https://mimo.xiaomi.com/mimo-v2-pro

https://weibo.com/u/1749127163

https://x.com/_LuoFuli/status/2034379957913129140

https://x.com/ArtificialAnlys/status/2034239267052896516

https://venturebeat.com/technology/xiaomi-stuns-with-new-mimo-v2-pro-llm-nearing-gpt-5-2-opus-4-6-performance

【活動分享】“48 小時，與 50+ 位大廠技術決策者，共探 AI 落地真路徑。”由 CSDN 與奇點智能研究院聯合舉辦的「全球機器學習技術大會」正式升級為「奇點智能技術大會」。2026 奇點智能技術大會將于 4 月 17-18 日在上海環球港凱悅酒店正式召開，大會聚焦大模型技術演進、智能體系統工程、OpenClaw 生態實踐及 AI 行業落地等十二大專題板塊，特邀來自BAT、京東、微軟、小紅書、美團等頭部企業的 50+ 位技術決策者分享實戰案例。這不僅是一場技術的盛宴，更是決策者把握 2026 AI 拐點的戰略機會。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.