![]()
羅福莉交上了在小米的第二份答卷。
3月19日,小米發布「面向Agent時代」的旗艦基座模型Xiaomi MiMo-V2-Pro,以及全模態基座模型Xiaomi MiMo-V2-Omni和語音合成模型Xiaomi MiMo-V2-TTS。
此前,羅福莉的第一份答卷,是去年12月小米發布的MiMo-V2-Flash,對標DeepSeek-V3.2。彼時,距離羅福莉剛正式宣布加入小米剛過去一個月。
頗具戲劇性的是,這次的新模型MiMo-V2-Pro、MiMo-V2-Omni的早期測試版在OpenRouter上匿名發布,API調用量多天登頂日榜,外界都在猜測是不是DeepSeek的新模型。
![]()
雷軍發微博表示,Mimo-V2-Pro,在Artificial Analysis上位列全球第八,如果按照大模型品牌來看,位列全球第五,超過了xAI的Grok。
“我們在AI領域上相對比較低調,實際進展可能比大家看到的要快很多。”
![]()
原本是低調的匿名測試,卻反而因為外界的“錯認”得到了肯定。從雷軍的表態不難看出,小米在AI領域的野心高筑。
而雷軍的底氣,大概很大程度上來自于如今小米AI的一員干將——小米MiMo大模型負責人羅福莉。
小米在AI領域發力很早,但并未躋身第一梯隊。去年12月,前DeepSeek核心成員、人稱“天才少女”的羅福莉加入小米,被外界視為小米AI研發“正規軍化”的里程碑。
此次模型發布,羅福莉在社交媒體上發文,形容新模型的發布:“我稱之為悄無聲息的伏擊。”
![]()
羅福莉解釋,這并非是團隊事先策劃了“伏擊”,而是從 Chat 到 Agent 的范式轉變來得太快,快到連團隊自己都有點難以置信。
但即便是刻意為之的“伏擊”又如何?在AI戰場上落后的小米,需要的正是一鳴驚人的能力與勇氣。
更妙的是,羅福莉最擅長的,正是從落后到拔尖、悄無聲息的伏擊。
01
低起點的“天才少女”
羅福莉最為人所熟知的稱號是“天才少女”,她自己卻并不認可。
“天才少女”的稱號始于2019年羅福莉第一次火出圈。
當時有人發現,北京大學計算機系的碩士研究生羅福莉,居然有“八篇ACL論文”。ACL是自然語言處理(NLP)領域的頂級國際會議,含金量極高,被譽為“NLP界奧斯卡”。這件事在知乎上發酵,崇拜、贊許、質疑的聲音同時涌來。
羅福莉親自在知乎發文解釋,稱自己向ACL投了兩篇論文,其他只是“部分參與了實驗室同學的研究”。之后羅福莉還曾回憶那段往事,認為2019年正逢AI論文集中爆發的時代,這也是她被關注到的一個背景。
六年后,羅福莉重新回到公眾視野,就是傳聞小米“千萬薪酬”招她加入之時。
人們回溯羅福莉從北大碩士畢業之后的軌跡——作為“阿里星”的身份直通阿里達摩院,然后加入DeepSeek,是DeepSeek-V2的關鍵開發者,如今又被小米高薪挖走,更加深了對她“天才少女”標簽的認同。
但羅福莉并不喜歡這個稱號。
加入小米,羅福莉發了個朋友圈:“請互聯網還我一片安安靜靜做事的氛圍吧,我不是天才少女,只想安安靜靜做難而正確的事情。”
![]()
羅福莉并非自謙,她絕對優秀,但絕非“天才”。
羅福莉1995年出生于四川宜賓,小時候并非尖子生,甚至經常排名靠后。好在父母不是打壓式教育,而是陪著羅福莉制定階段性的小目標,一步一步往上“挪”,真就逐漸成為了尖子生。
后來,羅福莉一心想去一線城市開拓視野,考入北京師范大學,讀電子專業,又轉專業進入了計算機系。在這里,羅福莉又要重走一遍小時候的路,她又排名靠后了。
五十個人左右的班級,羅福莉連前三十都進不去。編碼題別人三分鐘能做出來,她得用三個小時。
但是羅福莉當時已經盯上了保研北大的名額,每年只選三四個。用了一年的時間,羅福莉的成績穩在了保研線以上,又盯上了北大計算機系。
剛升到大三,羅福莉就開始試圖聯系北大的導師,成功進入了北大語言計算實驗室實習。十個實習生,只有一個保研到北大計算機系的名額。
而羅福莉,又墊底了。
同期的其他實習生都是北大本校的,她的專業基礎根本不夠用,連“人人都會”的通用編程語言Python都不會。
于是又是艱苦的“蝸牛爬”,羅福莉后來回憶那段日子,七天入門Python,四個月后以二作發了第一篇頂會論文,苦是真苦,值也是真值——她真的拿到了那唯一一個保研名額。
了解了羅福莉的這些經歷,就不難理解她對“天才少女”的拒絕。被稱作天才,實際上也是被抹殺了一路的努力,也抹殺了她最大的優勢。
02
從DeepSeek到小米
落后了,沒關系,追上去。這樣的羅福莉,和去年的小米是天作之合。加入小米之前,羅福莉還完成了一輪自我進化。
從北大研究生畢業之后,羅福莉沒有繼續讀博,而是進入了阿里達摩院。
專門針對頂尖畢業生的“阿里星”項目,江湖傳聞錄取率不到1%,羅福莉就是其中之一。
在阿里達摩院,羅福莉主導開發了多語言預訓練模型VECO,這個模型直接服務于跨境電商場景,重要性不言而喻。
羅福莉曾感慨“阿里一年,人間十年”,在阿里達摩院并不全是勝利和喜悅,也有挫敗和落寞。比如她很早就參與過千億參數模型訓練,但第一次做1750億參數規模的模型,數據清洗不到位、框架效率低下,最后喂出來的模型很大,卻臃腫不堪,并不“聰明”。
轉機出現在 ChatGPT 之后。行業補完了那一課,她也把之前踩過的坑一一理清。
2022年,羅福莉加入了當時連官網都沒有的、DeepSeek的母公司幻方量化。在DeepSeek,她開始重新審視科學的研究路徑:如何精準地Scaling參數與數據?如何設計高效的訓練架構?
羅福莉主導開發DeepSeek-V2,2024年5月發布,將推理成本降低至每百萬tokens僅1元人民幣,是GPT-4 Turbo的七十分之一,一度被稱為“AI界的拼多多”。
等到2025年,國內大廠掀起人才大戰的時候,羅福莉已經完成了從學術到工業的進化。
03
悄無聲息的伏擊
小米入局AI并不算晚,早在2023年8月,小米就曾發布MiLM-6B模型。去年6月發售的AI眼鏡,也曾在京東旗艦店打出五日銷量破萬的好成績。如果泛化到更廣闊的場景,小米在2021年就布局具身智能。
但是小米尚未躋身第一梯隊。
2023年5月,小米公開發聲“不會做OpenAI類的通用大模型”,但是時間到了2025年,雷軍顯然變了主意。
去年,一波人才搶奪戰在大廠打響。谷歌DeepMind原研究副總裁吳永輝出任字節AI研究部門Seed新負責人,字節還請來了谷歌原VideoPoet項目負責人蔣路,零一萬物原預訓練負責人黃文灝、阿里通義大模型原技術負責人周暢。
而雷軍也出手,重金從DeepSeek請來了羅福莉。傳聞中的“千億薪酬”,也讓羅福莉再一次成為輿論爭議的焦點。
小米的情況是復雜的。
難點在于要同時推進兩類不同方向的AI:一類是以應用和交互為核心的數字智能,另一類是面向真實場景的智能系統。前者更依賴模型能力與產品體驗,后者則涉及感知、決策與工程落地,技術路徑差異明顯。
大多數公司只聚焦其中一條,而小米需要同時探索兩條路徑,并思考它們之間的協同方式。國內需要這樣思考的公司不多。
去年12月,2025小米“人車家全生態”合作伙伴大會上,羅福莉作為第三位嘉賓上臺演講。
當天除了發布MiMo-V2-Flash之外,小米自研MiMo系列大模型家族赫然呈現:推理大模型、視覺推理大模型、原生端到端音頻生成模型、端側視覺語言大模型、具身大模型。
羅福莉直言有一些緊張,但是卻在臺上金句頻出。
羅福莉認為,下一代智能體系統不是一個“語言模擬器”,而是一個真正理解人類世界,并與之共存的“智能體”。
在她看來,AI進化的下個起點,一定是有一個能跟物理世界交互的模型。
![]()
AI不僅要看懂畫面,還要理解背后的物理規律;AI不僅要推理文本,而是理解世界的運作邏輯。
這不禁讓人想到李飛飛、楊立昆等頂尖學者所選擇的“世界模型”的路徑。
羅福莉說,這一點并非共識。
比如OpenAI的聯創之一、前首席科學家伊利亞·蘇茨克維(Ilya Sutskever)就認為,通過文本學習,模型也能內化出對世界的抽象認知和推理能力。換句話說,單靠語言就可以逼近通用智能。
羅福莉的野心,可見一斑。
羅福莉面臨的挑戰也更大,如果說之前的經歷讓她完成了從學術到工業應用的進化,那么在小米如此規模的企業擔任MiMo大模型負責人,她勢必還需要蹚過管理與協同的河。
她負責的團隊是大模型Core,直接歸屬于小米集團技術委員會管理。真正要落地,得面對的是各條已經跑起來的業務線——無論是終端,還是自動駕駛,背后都有自己成熟的研發團隊和既定節奏。
遙想十幾年前,小米第一次嘗試造芯,全資子公司松果電子研發,手機團隊并不買賬。2021年小米重啟造芯計劃的時候,就干脆放在了手機部之下。
小米連發三個模型,還只是個開始,模型能力還需進一步檢驗。羅福莉能否最終協助小米,如同她自己在人生中完成很多次的那樣,完成一場從落后到頂峰的“逆襲”,尚未可知。
這場悄無聲息的伏擊,能不能從一次漂亮的出手,變成長期的戰斗力?
參考資料:
1、北大人:《對話北大校友羅福莉:在自由的風里,做難而正確的事》
2、最人物:《年薪千萬,天才少女求放過》
3、智東西:《金句媲美雷軍!羅福莉首次站臺小米演講,揭秘MiMo大模型和背后團隊》
4、騰訊科技:《“雷軍的AI秘密武器”羅福莉首秀:詳解小米AGI之路》
5、新皮層NewNewThing:《入職小米后,羅福莉交卷了|大公司》
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.