3月2日,阿里千問發布了Qwen3.5小尺寸模型系列。馬斯克在X上點了贊,評價說「令人驚嘆的智能密度」。
林俊旸感謝了馬斯克的關注。
![]()
第二天下午,他向阿里提交了辭職申請。
3月4日凌晨,他發了一條推文:
"me stepping down. bye my beloved qwen."
![]()
24小時。從全球矚目到轉身離場。
一個語言學學生的意外路線
其實在所有標簽里面,我覺得最有意思的一個,大多數報道反而沒怎么展開。
林俊旸是北大計算機本科,這沒什么稀奇。但他的碩士,讀的是語言學——正兒八經的外國語學院語言學與應用語言學,不是CS方向的NLP。
一個學語言學的人,后來成了全球使用量最大的開源大語言模型的技術負責人。
這個路徑倒過來想就很有趣了。大語言模型的本質是什么?是對人類語言的建模。絕大多數做LLM的人從計算機科學出發,先懂算法再學語言規律。林俊旸反過來——他同時理解語言本身的結構,又有計算機的工程能力。
2020年GPT-3發布后,阿里達摩院內部調兵遣將。恰恰是因為他這個「語言學+技術」的復合背景,被分配到了周靖人領導的智能計算實驗室,成為M6模型團隊的核心開發者。
這個分配決定了后面所有的事情。
93年出生,2019年碩士畢業直接進阿里達摩院。沒有讀博,沒有海外經歷,純粹的本土培養路線。然后一路狂飆——M6(共同一作)、OFA(One-For-All)、Chinese CLIP,在多模態預訓練領域都是里程碑式的工作。Google Scholar被引量超過4萬次。
2022年底,達摩院AI團隊并入阿里云成立通義實驗室,林俊旸被任命為通義千問的技術負責人。
那年他29歲,成了阿里巴巴最年輕的P10級技術專家。阿里的技術體系里,很多工程師干了十幾年也到不了P10。他用了3年。
去年的AGI-Next峰會上,他和楊植麟、姚順雨、唐杰同臺,被媒體稱為「基模四強」。四個人代表了中國基礎大模型的主要力量。那個場景現在回看,多少有些唏噓。
![]()
全球第一,但全球第一的另一面
從2022年底接手到2026年初離開,林俊旸帶著千問走了大概3年。
這3年的成績單,數字說得比人清楚:在HuggingFace上,Qwen的衍生模型數量突破了20萬個,總下載量超過3億次,超越了Meta的Llama,成為全球被使用最多的開源模型。旗艦版Qwen3-Max超萬億參數,在多個權威評測中躋身全球前三,和GPT-5、Claude掰手腕。
![]()
注意,這里說的「全球第一」是指生態第一。全世界最多人下載、最多團隊基于它做二次開發的開源模型。某種意義上,這個「第一」的含金量比跑分更高。
而且產品側也終于打起來了。千問APP在2026年初經歷了爆發式增長。1月月活突破1億,春節期間DAU峰值飆到7352萬,到2月月活已經達到2.03億,增速552%全球第一,總量排全球第三。
我去年11月寫過一篇「橫掃硅谷的千問,殺回國內了」,當時Airbnb的CEO說他們大量依賴千問模型,「比OpenAI更好更便宜」。一個中國團隊做的開源模型,被硅谷公司當核心基礎設施在用。
但如果你從2024年一直跟到現在,會發現「全球第一」這個頭銜,其實藏著一些微妙的東西。
2024年的時候,Qwen確實是開源世界的領頭羊,沒什么爭議。但2025年DeepSeek爆發之后,整個格局變了。Kimi K2開源了,GLM-5開源了,MiniMax M2.5也開源了。開源不再是Qwen的獨家優勢,國內大模型的競爭格局變成了「一超三強」——DeepSeek一騎絕塵,Qwen、GLM、Kimi各有強項。
Qwen的位置變得有點微妙。它依然是全球下載量最大的開源模型,衍生模型數量也是全球第一。很多團隊拿Qwen當基座來做進一步訓練——Cursor的Composer模型被發現思考過程會輸出中文,有國產模型微調的痕跡;DeepSeek-R1也有基于Qwen的蒸餾版本。
某種意義上,Qwen成了AI世界的「Android」——底層無處不在,但品牌感知反而不那么強烈。
在具體賽道上也是這樣。Qwen采取的是「飽和式發布」策略——各種尺寸、各種模態不斷往外放,從0.6B到235B,從文本到視覺到語音,全覆蓋。開發者生態的優勢確實大,但也給人一種什么都做、什么都不夠極致的感覺。AI Coding領域Kimi K2的聲量更大,多模態世界模型方向Gemini 3系列走得更遠。Qwen什么都有,但沒有一個賽道是讓人第一時間聯想到它的。
![]()
產品側的問題更明顯。模型叫Qwen,產品叫通義,C端APP又叫通義千問——三個名字指向同一個東西但側重不同,品牌認知一直是割裂的。直到2025年11月APP才改名「千問」,而阿里正式把所有AI品牌統一為「千問」,是2026年3月2日的事——對,就是林俊旸提辭職的前一天。
開發者生態和消費者市場之間的鴻溝,千問一直沒有完全填上。APP月活突破2億是這個春節靠30億補貼砸出來的,留存率還是個問號。晚點小數據做過一張春節期間AI應用對比圖,很能說明問題:千問DAU在2月6日開始砸30億補貼后沖到高點,但不發紅包的DeepSeek反而用戶黏性最強——日均使用時長16分鐘,遠超其他三家。補貼能買來用戶,但買不來習慣。
![]()
Qwen在開發者圈子里的口碑確實好,但把模型優勢轉化成產品優勢,阿里走了很長一段彎路。
這種「模型很強但產品化一直差口氣」的狀態,可能是理解后面發生的事情的一個入口。
「團隊沒有跑路,我們還在」
在所有報道里,我翻到一個細節,挺能說明林俊旸是什么樣的人。
之前千問的代碼倉庫因為GitHub的標注問題被誤下架,網上一片恐慌,各種猜測滿天飛。林俊旸直接出來回應:「團隊沒有跑路,我們還在。」
就這么一句話,沒有官方聲明模板,沒有公關辭令,直接把事情說清楚了。
他的管理理念也挺有意思。他說過,做負責人「ego要小」——不要覺得自己無敵、能把所有事情做完。每個小團隊負責人最重要的事就是「招比自己更強的人」,如果做不到這一點,「是很失敗的」。
在AGI峰會上,當其他人聊模型能力的時候,他更關注客觀限制:「美國的算力可能整體比我們大1到2個數量級。」他說國內企業的算力主要用于交付,而美國公司在用算力做下一代的研究。這不是一個喜歡報喜不報憂的人。
他團隊里有很多00后。他說過,隨著這代年輕人進來,中國AI領域的冒險精神在增強。
這些細節拼在一起,你大概能感覺到這是一個什么樣的人——技術出身、性格直接、不太講客套、更信邏輯而不是關系。這種人適合從0到1地搭東西,但未必適合在復雜的組織架構里做政治博弈。
不是他自己的選擇
如果只看成績單,你很難理解林俊旸為什么要走。
千問剛發了新模型,馬斯克剛點了贊,全球第一的位置還坐著——按正常劇本,應該慶功、加薪、繼續沖。
但千問的核心貢獻者Chen Cheng在X上說了一句話:「離開似乎不是林俊旸自己的選擇。」
![]()
似乎不是自己的選擇。這句話的分量比什么分析都重。據晚點LatePost報道,有Qwen同事得知他將離職的消息后難掩情緒,「傷心地哭了」。
背后的直接原因,是通義實驗室正在進行的一場組織調整。
簡單說,阿里打算把Qwen團隊從「垂直整合」改成「水平分工」。原來的千問團隊是一個統一體,從預訓練到后訓練,從文本到多模態,一個團隊端到端負責。現在要拆——預訓練一個組,后訓練一個組,文本一個組,多模態一個組。
林俊旸的管理范圍,被縮小了。
這種拆法和他的技術理念直接沖突。他多次公開表達過,預訓練、后訓練和Infra團隊應該「更緊密地結合和溝通」,而不是拆開各自為戰。做大模型,他認為廚師得全程把控——從選材到烹飪到擺盤。公司覺得不行,選材的歸選材,烹飪的歸烹飪,流水線效率更高。
與此同時,阿里從外部引入了前DeepMind高級資深研究員周浩來接替后訓練負責人的位置。據晚點報道,周浩是Gemini 3.0、DeepResearch等項目的關鍵貢獻者,曾領導針對Gemini 3.0的多步驟強化學習——這恰恰是千問當前最需要補強的方向。一個從零搭建團隊的人,看著外來的人帶著更前沿的方法論接管自己搭建的東西——這種感受不難想象。
V2EX上有人說得挺扎心:「業務發展期強行提的P10,業務穩定后就守不住位置了。」
這話聽著刺耳,但確實點到了一個結構性的問題。大廠在「攻城」階段和「守城」階段需要的人是不一樣的。攻城的人被推到最高位,守城的時候就容易成為被優化的對象。不是能力不行,是公司進入了不同的階段。
而且林俊旸不是一個人走的。同一天,后訓練負責人郁博文也正式離職。Qwen Code負責人惠彬原早在1月就離開了,去了Meta。核心貢獻者Kaixin Li發文告別。Binyuan Hui也跟著說了句「bye qwen, me too」。
不是一個人的離開,是一群人的散場。
一代人的命運
把視角拉遠一點看,這不是千問一個團隊的故事。
字節跳動的Seed團隊,2025年走了7個研究骨干。喬思遠去了Meta,姜璐去了Apple,馮佳時成了騰訊多模態團隊的負責人。智譜AI半年內4名高管離職,包括副總裁和首席戰略官。阿里通義實驗室自己的NLP負責人、視覺負責人、語音負責人,也都先后離開了。
這一波人有個共同特征:大多是2019到2022年間加入公司的,趕上了大模型從零起步的黃金期。他們是親手搭地基的人。
林俊旸、郁博文、惠彬原——還有個更具體的共同點:都是應屆畢業直接進的阿里。據晚點報道,林俊旸2019年北大碩士畢業,郁博文2022年中科院博士畢業、當年的「阿里星」,99年出生的惠彬原2022年天津大學碩士畢業。三個人從零開始搭建,一路做到核心。不是空降的高管,不是挖來的大佬,是阿里自己培養出來的。
然后,阿里自己做了一輪組織調整,這批人就散了。
這不是誰對誰錯的問題。大模型賽道從「技術敘事」進入了「商業化」階段。公司開始算ROI了,開始問「開源到底能賺多少錢」了。千問的APP雖然春節期間靠補貼沖到了2億月活,但開源模型本身幾乎不產生授權收入,品牌認知也是剛剛才理順。公司自然會想:是不是該換個打法了?
我之前寫Dario Amodei那篇文章時說過一句話:「當信仰和生意完美對齊的時候,你無法分辨一個人到底是在堅持原則,還是在做精明的品牌定位。」放到這里也一樣——當技術理想和公司戰略對齊的時候,一切和諧美好。一旦出現分歧,走人往往是唯一的選項。
區別在于,AI行業的人才不愁去處。據晚點報道,在這次變動之前,已有多位投資人和大公司在接觸林俊旸,有人期待他創業,有人給出工作offer。
所以「bye my beloved qwen」這句話,讀起來有一種復雜的味道。不是悲情。更像是一個建造者對自己作品的告別——你傾注了3年心血做出的東西還在,還會繼續跑,全球第一的位置大概率能保持一陣子。但你已經不是開它的人了。
留下的問題
千問不會因此垮掉。模型在那里,代碼在那里,20萬個衍生模型在全世界的服務器上跑著。3800億砸下去,總會有新的人補上來。
但有些東西確實不一樣了。
去年他們花了將近一年時間攻克Qwen3的三個核心難題:讓強化學習框架穩定支撐長時序推理、平衡跨領域數據分布、強化多語言能力。這種過程靠的不是組織架構圖上的匯報線,而是一群人真的相信同一件事。
現在這群人散了。千問可能在新的架構下反而跑得更快。水平分工在規模化階段有它的道理。建造者和維護者本來就是兩種角色,沒有高下之分。
而林俊旸他們帶走的東西——經驗、直覺、踩過的坑——不管去了哪兒,都會繼續發揮作用。人散了,能力不會消失,只是換了個地方生長。
32歲,全球第一,說走就走。
在AI這個行業里,也許這就是某種正常。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.