![]()
![]()
千問靈魂林俊旸離職,算力圍城里的天才大逃亡。
作者|栗子
“me stepping down. bye my beloved qwen.(我將卸任。再見,我親愛的Qwen。)”
3月4日凌晨,阿里Qwen團隊技術負責人林俊旸在自己的社交媒體上寫下了這句頗顯落寞與無奈的話。
![]()
短短十幾個英文字符,不僅正式宣告了這位Qwen靈魂人物與阿里關系的終結,也引發了中國AI行業的巨大討論。
要知道,如今的Qwen大模型,在世界開源AI模型領域都頗具競爭力。
3月2日晚間,阿里開源四款Qwen 3.5小尺寸模型系列。很快,埃隆·馬斯克就點贊了這條社交媒體推文,并評論“Impressive intelligence density”(令人印象深刻的智能密度)。
然而,這一切都隨著林俊旸的表態而充滿變數。據晚點LatePost報道,有Qwen團隊同事得知他將離職的消息后難掩情緒,“傷心地哭了”。
離開的不只有林俊旸。同一天,Qwen的后訓練負責人郁博文也正式離職。他的工作將由今年初加入阿里通義實驗室的前 DeepMind 高級資深研究員周浩接任。
一邊是來自世界的點贊,一邊是核心團隊陸續出走。對于那些視Qwen為中國開源希望的開發者而言,這更像是一個深刻的追問:面對算力圍城,那些AI天才們是否只有出走這一條路?
1.從語言學碩士到阿里最年輕P10
林俊旸并不是典型的AI人才,他的學術起點甚至會讓你感覺有點“意外”。
2019年,他以北京大學外國語言學及應用語言學專業碩士的身份畢業,隨后通過校招加入了阿里AI研究機構達摩院的智能計算實驗室(現通義實驗室前身),成為一名專注自然語言處理與大模型研究的算法專家。
從自然語言的底層邏輯和語言學本體切入大語言模型的研究,賦予了他對語言本質、跨模態表征對齊以及復雜指令工程更為敏銳的直覺。這種直覺在后續Qwen模型對多語種,特別是小語種的高質量支持中體現的淋漓盡致。
在阿里的六年歲月中,林俊旸的職級躍升堪稱不可思議。
他僅用短短六年時間就從P6升級到P10。在2025年5月完成最近一次晉升時,年僅約32歲的他成為了阿里目前最年輕的P10專家之一。
而回望林俊旸在阿里的履歷,幾乎就是阿里AI大模型從早期探索者到現在領導者的記錄。
因為他在Qwen團隊中的實際角色不僅是管理者,更是核心架構的奠基人與關鍵代碼的一線貢獻者。
在通義千問正式立項之前,林俊旸就已經是阿里早期萬億級多模態大模型M6的核心研發成員及共同第一作者。而M6項目在2021年實現了十萬億參數規模的跨越,為阿里積累了早期極為寶貴的大規模分布式訓練經驗。
![]()
2022年,通義千問正式立項,林俊旸順理成章地成為核心架構成員,并于同年正式升任該項目的技術負責人。在他的全面主導下,Qwen實現了從早期的雛形到Qwen 1.5、Qwen 2,再到2025年推出的Qwen 3系列的全尺寸開源爆發。
他不僅帶隊完成了從微型模型到旗艦混合專家模型的矩陣構建,還親自統籌了Qwen-VL(視覺語言模型)、Qwen-Audio(音頻理解模型)以及Qwen-Coder(代碼生成模型)等關鍵垂直領域的突破。
在學術影響力方面,作為核心通訊作者之一署名的《Qwen Technical Report》系列文獻,單篇引用量動輒突破數千次,幫助Qwen確立了在國際自然語言處理學術界的權威地位。
2025年10月,林俊旸更是在X平臺上雄心勃勃地宣布,已在Qwen體系下組建了全新的“機器人與具身智能”極客小分隊,讓多模態模型從虛擬數據世界真正邁向物理交互世界。
![]()
無奈的是,即使是這樣一位從應屆生摸爬滾打成長起來、戰功赫赫,且帶領團隊在全球最頂尖榜單上為公司斬獲無數榮光的天才少年,最終也無法在龐大的商業化機器中保全自己所堅守的技術路線。
而這篇社交媒體,或許是他在掛印而去之前,為阿里巴巴AI版圖描繪的最后一張具有宏大野心的技術藍圖。
2.為什么林俊旸會離職?
值得注意的是,林俊旸選擇宣布離開的時機,恰逢阿里剛剛開源了Qwen 3.5系列的小尺寸模型、并在全球范圍內獲得馬斯克等科技巨頭點贊的次日。
這一時間點也許并非巧合,更像是團隊內部矛盾積攢到一定程度的集中爆發。
據「甲子光年」了解,在此前Qwen的快速推進中,林俊旸一直極力試圖在阿里內部維持一個“垂直整合”的研發閉環,覆蓋從模型預訓練、后訓練與人類價值觀對齊,直到底層基礎設施優化的所有核心職能。
因為林俊旸認為,在前沿大模型探索進入深水區后,Scaling Law的紅利正在遞減,預訓練、后訓練以及Infra架構必須緊密咬合、協同創新,才能實現類似GPT o1那樣在邏輯推理深度上的范式突破。
但也許這種想法并不被管理層接受。
據晚點LatePost報道,近期,通義實驗室計劃將Qwen團隊分拆,從涵蓋不同訓練流程和模態的 “垂直整合” 體系,變成預訓練、后訓練、文本、多模態等一個個分開的水平分工團隊,
盡管這些團隊仍隸屬通義實驗室,但林俊旸的管理范圍被縮小,而且更關鍵的是,這顯然是對林俊旸堅守的技術路線的根本性否定。
與此同時,曾任職于Google DeepMind的高級資深研究員周浩在2026年初以“空降兵”的姿態加入阿里,直接向周靖人匯報,并順勢接手了另一位離職骨干郁博文留下的后訓練團隊核心業務,這顯然進一步架空了林俊旸。
但這僅僅是表面現象,更深層的沖突在于“開源信仰”與“閉源變現”之間不可調和的博弈。
作為阿里AI戰略版圖中的重要棋子,高層對Qwen的期待始終處于分裂狀態。
一方面,他們需要Qwen通過開源在國際社區賺取口碑,以此反哺阿里云的品牌價值,降低獲客成本;
另一方面,商業化部門又時刻擔心過于強大的開源模型會殺死自己的閉源生意——如果用戶在本地就能部署高性能Qwen,誰還會去為昂貴的API接口和百煉平臺的閉源模型付費?
這種既要開源帶來的生態勢能,又想守住閉源帶來的直接利潤的貪婪,最終讓林俊旸這樣的開源推動者陷入了腹背受敵的窘境。
高層對商業化的壓力,傳遞到下面就變成了略顯荒誕的內部考核體系。
據知情人士透露,內部管理層在巨大的商業變現壓力下,竟然嘗試引入DAU(日活用戶數)、留存率等典型的C端消費級產品運營指標,來作為考核專注于底層基座模型研發的Qwen科研團隊的核心KPI。
這種問題在于,當基座模型科研團隊被迫背負DAU等短線數據增長指標時,團隊的動作將不可避免地發生變形。為了完成季度KPI,研究團隊不得不放棄那些需要漫長周期、極高失敗風險的底層創新,轉而去討論如何通過調整語氣來迎合某些業務部門的KPI指標。
這種“算力圍城”里的損耗,在此時便成了無法忍受的生命浪費。
顯然,當繼續留在阿里推進頂尖開源研究的技術自治空間被徹底封死,林俊旸的離開便成了保留極客尊嚴的唯一選擇。
3.天才的終點不應是圍城
毋庸置疑,目前的Qwen早已超越了阿里內部技術底座的范疇,它是中國乃至整個非英語世界開源大模型生態中唯一的一面旗幟。
在Hugging Face等全球主流的開源模型托管平臺上,Qwen的生態地位已經跨越了單純的“強力參與者”階段,演變為真正的“霸榜者”,甚至能夠與世界頂級的閉源模型直接競爭。
比如2月16日,阿里巴巴開源的全新一代基座大模型Qwen3.5-Plus。
即使有媒體報道,阿里內部有高管對除夕夜亮相發布的 Qwen-3.5 并不完全滿意,稱其是一個 “半成品”。但卻不能否認,其旗艦模型Qwen3.5-397B-A17B不僅在性能指標上正面硬剛谷歌Gemini 3 Pro與OpenAI GPT-5.2,更憑借一系列破壞性的技術指標重塑了全球開源生態的天花板。
只不過,Qwen能否繼續自己在開源AI模型上的高歌猛進,從今天開始也許要打上一個問號。
事實上,在林俊旸離開之前,阿里大模型團隊已有不少骨干離職。
![]()
2022年至今阿里AI核心團隊離職統計,制圖:甲子光年
這場人才的大規模出走,揭示了一個尷尬的現實:阿里似乎擁有全球最頂級的計算資源,卻無法提供能夠容納這些天才靈魂的軟性環境。
當核心人才不斷向外部流失,他們帶走的不止是技術本身,更是Qwen系列得以在激烈的全球競爭中保持敏銳嗅覺的“技術直覺”。
“Bye my beloved qwen。”
林俊旸的這句話,相信是自己對Qwen付出多年心血的真情流露。這種深情與決絕的并存,是中國AI行業最令人心碎的注腳。
Qwen曾是他心中的孩子。但在商業帝國的重力場下,一個天才的離職,竟然成了他保全技術信仰的最后一種儀式。
林俊旸的告別,或許只是一個新篇章的序幕。在那些為他流下眼淚的骨干成員心中,一顆種子已經種下:如果圍城內無法通往AGI,那么未來的戰場,必然在那片由天才們親手開辟的、自由而殘酷的荒野之上。
(封面圖來源:“AGI-Next”峰會)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.