網易首頁 > 網易號 > 正文申請入駐

32歲，全球第一開源模型掌舵人，說了聲bye就走了

2026-03-04 12:17:05　來源: AI進化論花生

北京舉報

分享至

3月2日，阿里千問發布了Qwen3.5小尺寸模型系列。馬斯克在X上點了贊，評價說「令人驚嘆的智能密度」。

林俊旸感謝了馬斯克的關注。

第二天下午，他向阿里提交了辭職申請。

3月4日凌晨，他發了一條推文：

"me stepping down. bye my beloved qwen."

24小時。從全球矚目到轉身離場。

一個語言學學生的意外路線

其實在所有標簽里面，我覺得最有意思的一個，大多數報道反而沒怎么展開。

林俊旸是北大計算機本科，這沒什么稀奇。但他的碩士，讀的是語言學——正兒八經的外國語學院語言學與應用語言學，不是CS方向的NLP。

一個學語言學的人，后來成了全球使用量最大的開源大語言模型的技術負責人。

這個路徑倒過來想就很有趣了。大語言模型的本質是什么？是對人類語言的建模。絕大多數做LLM的人從計算機科學出發，先懂算法再學語言規律。林俊旸反過來——他同時理解語言本身的結構，又有計算機的工程能力。

2020年GPT-3發布后，阿里達摩院內部調兵遣將。恰恰是因為他這個「語言學+技術」的復合背景，被分配到了周靖人領導的智能計算實驗室，成為M6模型團隊的核心開發者。

這個分配決定了后面所有的事情。

93年出生，2019年碩士畢業直接進阿里達摩院。沒有讀博，沒有海外經歷，純粹的本土培養路線。然后一路狂飆——M6（共同一作）、OFA（One-For-All）、Chinese CLIP，在多模態預訓練領域都是里程碑式的工作。Google Scholar被引量超過4萬次。

2022年底，達摩院AI團隊并入阿里云成立通義實驗室，林俊旸被任命為通義千問的技術負責人。

那年他29歲，成了阿里巴巴最年輕的P10級技術專家。阿里的技術體系里，很多工程師干了十幾年也到不了P10。他用了3年。

去年的AGI-Next峰會上，他和楊植麟、姚順雨、唐杰同臺，被媒體稱為「基模四強」。四個人代表了中國基礎大模型的主要力量。那個場景現在回看，多少有些唏噓。

全球第一，但全球第一的另一面

從2022年底接手到2026年初離開，林俊旸帶著千問走了大概3年。

這3年的成績單，數字說得比人清楚：在HuggingFace上，Qwen的衍生模型數量突破了20萬個，總下載量超過3億次，超越了Meta的Llama，成為全球被使用最多的開源模型。旗艦版Qwen3-Max超萬億參數，在多個權威評測中躋身全球前三，和GPT-5、Claude掰手腕。

注意，這里說的「全球第一」是指生態第一。全世界最多人下載、最多團隊基于它做二次開發的開源模型。某種意義上，這個「第一」的含金量比跑分更高。

而且產品側也終于打起來了。千問APP在2026年初經歷了爆發式增長。1月月活突破1億，春節期間DAU峰值飆到7352萬，到2月月活已經達到2.03億，增速552%全球第一，總量排全球第三。

我去年11月寫過一篇「橫掃硅谷的千問，殺回國內了」，當時Airbnb的CEO說他們大量依賴千問模型，「比OpenAI更好更便宜」。一個中國團隊做的開源模型，被硅谷公司當核心基礎設施在用。

但如果你從2024年一直跟到現在，會發現「全球第一」這個頭銜，其實藏著一些微妙的東西。

2024年的時候，Qwen確實是開源世界的領頭羊，沒什么爭議。但2025年DeepSeek爆發之后，整個格局變了。Kimi K2開源了，GLM-5開源了，MiniMax M2.5也開源了。開源不再是Qwen的獨家優勢，國內大模型的競爭格局變成了「一超三強」——DeepSeek一騎絕塵，Qwen、GLM、Kimi各有強項。

Qwen的位置變得有點微妙。它依然是全球下載量最大的開源模型，衍生模型數量也是全球第一。很多團隊拿Qwen當基座來做進一步訓練——Cursor的Composer模型被發現思考過程會輸出中文，有國產模型微調的痕跡；DeepSeek-R1也有基于Qwen的蒸餾版本。

某種意義上，Qwen成了AI世界的「Android」——底層無處不在，但品牌感知反而不那么強烈。

在具體賽道上也是這樣。Qwen采取的是「飽和式發布」策略——各種尺寸、各種模態不斷往外放，從0.6B到235B，從文本到視覺到語音，全覆蓋。開發者生態的優勢確實大，但也給人一種什么都做、什么都不夠極致的感覺。AI Coding領域Kimi K2的聲量更大，多模態世界模型方向Gemini 3系列走得更遠。Qwen什么都有，但沒有一個賽道是讓人第一時間聯想到它的。

產品側的問題更明顯。模型叫Qwen，產品叫通義，C端APP又叫通義千問——三個名字指向同一個東西但側重不同，品牌認知一直是割裂的。直到2025年11月APP才改名「千問」，而阿里正式把所有AI品牌統一為「千問」，是2026年3月2日的事——對，就是林俊旸提辭職的前一天。

開發者生態和消費者市場之間的鴻溝，千問一直沒有完全填上。APP月活突破2億是這個春節靠30億補貼砸出來的，留存率還是個問號。晚點小數據做過一張春節期間AI應用對比圖，很能說明問題：千問DAU在2月6日開始砸30億補貼后沖到高點，但不發紅包的DeepSeek反而用戶黏性最強——日均使用時長16分鐘，遠超其他三家。補貼能買來用戶，但買不來習慣。

Qwen在開發者圈子里的口碑確實好，但把模型優勢轉化成產品優勢，阿里走了很長一段彎路。

這種「模型很強但產品化一直差口氣」的狀態，可能是理解后面發生的事情的一個入口。

「團隊沒有跑路，我們還在」

在所有報道里，我翻到一個細節，挺能說明林俊旸是什么樣的人。

之前千問的代碼倉庫因為GitHub的標注問題被誤下架，網上一片恐慌，各種猜測滿天飛。林俊旸直接出來回應：「團隊沒有跑路，我們還在。」

就這么一句話，沒有官方聲明模板，沒有公關辭令，直接把事情說清楚了。

他的管理理念也挺有意思。他說過，做負責人「ego要小」——不要覺得自己無敵、能把所有事情做完。每個小團隊負責人最重要的事就是「招比自己更強的人」，如果做不到這一點，「是很失敗的」。

在AGI峰會上，當其他人聊模型能力的時候，他更關注客觀限制：「美國的算力可能整體比我們大1到2個數量級。」他說國內企業的算力主要用于交付，而美國公司在用算力做下一代的研究。這不是一個喜歡報喜不報憂的人。

他團隊里有很多00后。他說過，隨著這代年輕人進來，中國AI領域的冒險精神在增強。

這些細節拼在一起，你大概能感覺到這是一個什么樣的人——技術出身、性格直接、不太講客套、更信邏輯而不是關系。這種人適合從0到1地搭東西，但未必適合在復雜的組織架構里做政治博弈。

不是他自己的選擇

如果只看成績單，你很難理解林俊旸為什么要走。

千問剛發了新模型，馬斯克剛點了贊，全球第一的位置還坐著——按正常劇本，應該慶功、加薪、繼續沖。

但千問的核心貢獻者Chen Cheng在X上說了一句話：「離開似乎不是林俊旸自己的選擇。」

似乎不是自己的選擇。這句話的分量比什么分析都重。據晚點LatePost報道，有Qwen同事得知他將離職的消息后難掩情緒，「傷心地哭了」。

背后的直接原因，是通義實驗室正在進行的一場組織調整。

簡單說，阿里打算把Qwen團隊從「垂直整合」改成「水平分工」。原來的千問團隊是一個統一體，從預訓練到后訓練，從文本到多模態，一個團隊端到端負責。現在要拆——預訓練一個組，后訓練一個組，文本一個組，多模態一個組。

林俊旸的管理范圍，被縮小了。

這種拆法和他的技術理念直接沖突。他多次公開表達過，預訓練、后訓練和Infra團隊應該「更緊密地結合和溝通」，而不是拆開各自為戰。做大模型，他認為廚師得全程把控——從選材到烹飪到擺盤。公司覺得不行，選材的歸選材，烹飪的歸烹飪，流水線效率更高。

與此同時，阿里從外部引入了前DeepMind高級資深研究員周浩來接替后訓練負責人的位置。據晚點報道，周浩是Gemini 3.0、DeepResearch等項目的關鍵貢獻者，曾領導針對Gemini 3.0的多步驟強化學習——這恰恰是千問當前最需要補強的方向。一個從零搭建團隊的人，看著外來的人帶著更前沿的方法論接管自己搭建的東西——這種感受不難想象。

V2EX上有人說得挺扎心：「業務發展期強行提的P10，業務穩定后就守不住位置了。」

這話聽著刺耳，但確實點到了一個結構性的問題。大廠在「攻城」階段和「守城」階段需要的人是不一樣的。攻城的人被推到最高位，守城的時候就容易成為被優化的對象。不是能力不行，是公司進入了不同的階段。

而且林俊旸不是一個人走的。同一天，后訓練負責人郁博文也正式離職。Qwen Code負責人惠彬原早在1月就離開了，去了Meta。核心貢獻者Kaixin Li發文告別。Binyuan Hui也跟著說了句「bye qwen, me too」。

不是一個人的離開，是一群人的散場。

一代人的命運

把視角拉遠一點看，這不是千問一個團隊的故事。

字節跳動的Seed團隊，2025年走了7個研究骨干。喬思遠去了Meta，姜璐去了Apple，馮佳時成了騰訊多模態團隊的負責人。智譜AI半年內4名高管離職，包括副總裁和首席戰略官。阿里通義實驗室自己的NLP負責人、視覺負責人、語音負責人，也都先后離開了。

這一波人有個共同特征：大多是2019到2022年間加入公司的，趕上了大模型從零起步的黃金期。他們是親手搭地基的人。

林俊旸、郁博文、惠彬原——還有個更具體的共同點：都是應屆畢業直接進的阿里。據晚點報道，林俊旸2019年北大碩士畢業，郁博文2022年中科院博士畢業、當年的「阿里星」，99年出生的惠彬原2022年天津大學碩士畢業。三個人從零開始搭建，一路做到核心。不是空降的高管，不是挖來的大佬，是阿里自己培養出來的。

然后，阿里自己做了一輪組織調整，這批人就散了。

這不是誰對誰錯的問題。大模型賽道從「技術敘事」進入了「商業化」階段。公司開始算ROI了，開始問「開源到底能賺多少錢」了。千問的APP雖然春節期間靠補貼沖到了2億月活，但開源模型本身幾乎不產生授權收入，品牌認知也是剛剛才理順。公司自然會想：是不是該換個打法了？

我之前寫Dario Amodei那篇文章時說過一句話：「當信仰和生意完美對齊的時候，你無法分辨一個人到底是在堅持原則，還是在做精明的品牌定位。」放到這里也一樣——當技術理想和公司戰略對齊的時候，一切和諧美好。一旦出現分歧，走人往往是唯一的選項。

區別在于，AI行業的人才不愁去處。據晚點報道，在這次變動之前，已有多位投資人和大公司在接觸林俊旸，有人期待他創業，有人給出工作offer。

所以「bye my beloved qwen」這句話，讀起來有一種復雜的味道。不是悲情。更像是一個建造者對自己作品的告別——你傾注了3年心血做出的東西還在，還會繼續跑，全球第一的位置大概率能保持一陣子。但你已經不是開它的人了。

留下的問題

千問不會因此垮掉。模型在那里，代碼在那里，20萬個衍生模型在全世界的服務器上跑著。3800億砸下去，總會有新的人補上來。

但有些東西確實不一樣了。

去年他們花了將近一年時間攻克Qwen3的三個核心難題：讓強化學習框架穩定支撐長時序推理、平衡跨領域數據分布、強化多語言能力。這種過程靠的不是組織架構圖上的匯報線，而是一群人真的相信同一件事。

現在這群人散了。千問可能在新的架構下反而跑得更快。水平分工在規模化階段有它的道理。建造者和維護者本來就是兩種角色，沒有高下之分。

而林俊旸他們帶走的東西——經驗、直覺、踩過的坑——不管去了哪兒，都會繼續發揮作用。人散了，能力不會消失，只是換了個地方生長。

32歲，全球第一，說走就走。

在AI這個行業里，也許這就是某種正常。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.