![]()
昨天深夜,小米沒有發布會,沒有預熱,沒有倒計時,直接上線了三款大模型:MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS。
Pro主攻語言理解和Agent能力,Omni主打多模態感知——音頻、圖像、視頻全收,TTS專攻語音合成。三款一起,覆蓋了AI Agent需要的"認知、感知、表達"三層完整能力。
數據也不含糊。Omni的圖像理解超過Claude Opus 4.6,音頻理解超過Gemini 3 Pro;Pro的代碼能力拿下開源模型第一,Agent測評Top2;TTS訓練數據規模達上億小時,支持普通話、粵語、四川話多種方言。更早發布的MiMo-V2-Flash,推理價格是Claude的2.5%,速度是DeepSeek的3倍。
科技圈當晚炸了一鍋。討論焦點集中在一件事上:小米,一家手機和汽車公司,為什么要在AI軍備競賽最激烈的時候,突然跳進大模型這個坑?
這個問題問對了,但答案大多數人沒想清楚。
大多數報道的解讀是:小米在追AI浪潮,補技術短板。
這個解讀沒有錯,但停在了最淺的那一層。
![]()
小米在打防御戰
先把小米的核心資產擺出來。
不是手機,不是汽車——是那張網。7.42億月活用戶,10.4億IoT連接設備,15000家硬件合作伙伴。"人車家全生態"這個戰略,用大白話說就是:小米在用戶生活里布了密密麻麻的硬件入口,手機、電視、空調、音箱、汽車,每一個都是一個觸點。
這張網,是小米過去二十年建起來最值錢的東西。
但它現在面臨一個根本性的威脅,而且這個威脅不來自任何競爭對手,它來自AI本身的發展邏輯。
問題很簡單:如果用戶在小米設備上獲得的那個最關鍵的AI體驗,是由OpenAI或者DeepSeek提供的,那小米的硬件生態實際上退化成了什么?
退化成了一個渠道。它有入口,但不控制體驗;它有用戶,但黏性屬于別人。
Thompson的聚合理論說得很清楚:在互聯網時代,誰控制了用戶體驗,誰就控制了價值鏈。硬件入口曾經是最重要的護城河,但當AI成為用戶和設備之間最核心的那層交互,硬件就開始變成載體,而不是主角。
小米比任何人都更清楚這件事的后果,因為它手上握著10.4億臺設備——這是它最大的優勢,同時也是它失去控制權之后損失最慘的地方。
自研大模型,本質上是在做一件事:不讓自己花了二十年建起來的硬件生態,變成別人AI能力的免費分發渠道。
為什么是這三款?
這是整件事最值得細看的地方,也是大多數報道沒有說清楚的地方。
Pro管語言理解和Agent能力,Omni管多模態感知——音頻、圖像、視頻,TTS管語音合成。
單獨看每一款,都是技術產品。放在一起看,是一個完整的AI Agent能力棧:
聽得見,看得懂,想得清,說得出。
把這四個能力放進小米的硬件場景里:你在家里說一句話,家居系統聽見了;你把手機攝像頭對著冰箱,AI看懂了里面有什么;它推理出你今天的晚餐建議,然后用自然的語音告訴你,同時自動預熱了烤箱。
這不是一個聊天AI。這是一個能在真實物理空間里感知、推理、執行、反饋的系統。
"人車家全生態"這個戰略,以前靠的是硬件互聯——設備之間能互相通話。現在小米要把它升級成另一件事:場景智能——AI理解你在哪里、在做什么、需要什么,然后跨設備協同響應。
這個升級靠調用別人的API做不到,因為那個AI不理解小米生態的上下文,不知道你家里有哪些設備,不知道你的使用習慣,不知道這套硬件系統的邊界在哪里。只有自研,才能把模型能力和硬件場景真正焊在一起。
三款模型的組合,不是技術炫耀,是能力補全。小米在給自己的10.4億臺設備裝感知和大腦。
“開源”比模型本身更值得看
MiMo-V2-Flash全面開源,推理代碼也開源,API限時免費。
很多人把這理解成技術自信,或者大方。
然而,開源是一種戰略,不是慷慨。它的邏輯鏈是這樣的:
開源模型→開發者涌入,基于MiMo構建應用→這些應用優先在小米生態里跑→小米生態的軟件密度上升→對硬件合作伙伴的吸引力增強→更多設備接入→生態壁壘加厚。
飛輪的起點是開發者。小米現在有120萬開發者,這是它手上被嚴重低估的資產。如果這120萬人開始基于MiMo構建Agent應用,小米的硬件生態就會在軟件側形成真正的壁壘——不靠封閉,靠密度。
這個邏輯,谷歌用安卓做過一次。開源安卓,不是為了讓別人免費用,是為了讓全球開發者都在安卓生態里工作,從而讓安卓成為誰也繞不開的基礎設施。
小米在用同樣的邏輯,在AI時代試著重演一次。當然,安卓花了十年才建起那個生態,小米能不能走到那一步,還是另一個問題。
雇什么人,就是在押注什么方向
羅福莉這個人值得單獨說一下。
![]()
她從DeepSeek出來,低調加入小米,首秀拿出了一個Agent能力和代碼能力比肩頂級閉源模型的開源大模型。盧偉冰透露,過去四個季度AI投入環比增速超50%,單崗位薪酬上限開到了千萬級別。
雷軍花這個價錢挖的不是泛化的AI研究員。羅福莉最擅長的是推理模型和Agent——這兩個方向和小米的硬件場景是精確匹配的。家居、汽車需要的不是一個會聊天的AI,需要的是一個能執行任務、調用工具、在多步驟指令里不出錯的Agent。
人挖對了,方向才是對的。
羅福莉在演講里說了一句話值得記住:"算力和數據也并非最后的護城河。"這不是謙虛,這是她真實的判斷——如果護城河只靠算力堆,那資源最多的公司永遠贏,小米沒有機會。她和小米押注的是另一條路:在推理效率和Agent能力上做出差異,用更小的參數、更低的成本,跑出更實用的結果。
MiMo-V2-Flash的參數是DeepSeek V3家族的一半,但在代碼和Agent榜單上打到了第一梯隊。這條技術路線如果走通了,對小米意味著:它不需要和字節、阿里拼算力軍備,它可以在效率上找到自己的位置。
但有一個問題還沒有答案。
小米的邏輯說得通,方向也是對的。但做到了能力閉環是一回事,做到了體驗閉環是另一回事。
模型夠強,不等于用戶在小米設備上感受到的AI體驗就夠好。從自研模型到真正打通人車家全場景的AI交互,中間還有大量的工程整合工作——怎么把Omni的感知能力接進家居系統?怎么讓汽車里的AI知道你剛離開家時家里的狀態?怎么在不同設備之間保持上下文連續?
這些不是大模型能力問題,是系統整合問題。而系統整合,歷來是最難、最慢、最容易出現裂縫的地方。
小米說自己要做這件事,三款模型是第一步。
但第一步和真正走到終點,中間的距離,還不知道有多遠。
本期內容
作者:魚程西
校對:王成聞
往期洞察 >
啟境GT7被全網群嘲,但華為根本不在乎
英偉達最重要的GTC大會落幕:什么都做,但有一件事絕對不碰
林俊旸離開12天后,阿里將千問塞進了ATH
孔二
賬號介紹
Self - introduction
咨詢公司創始人,資深科技參與者、觀察者。
「專注科技產品,也專注創造產品的科技本身;專注科技產業,也專注推動產業的科技人物」。
前奧美創意總監,熟諳重大事件策劃,虎嗅、鈦媒體、網易等多家內容平臺熱門作者,推出營銷專業理論“營銷七象”。
爆文《賈躍亭怒沉百寶箱》《劉強東的開學第一課》等多篇科技點評獲得500萬+閱讀,被全網推薦轉載。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.