32歲林俊旸官宣告別，阿里大模型就此轉(zhuǎn)向？

2026-03-06 16:49:57　來源: Morketing

北京舉報

分享至

文 | Innocent Roland

2026年3月4日凌晨，阿里巴巴通義千問（Qwen）技術(shù)負責人林俊旸在社交媒體X（原推特）上發(fā)布了一條簡短的推文：“me stepping down. bye my beloved qwen”（我要卸任了。再見，我親愛的Qwen）。

然而就在前兩天，Qwen剛把Qwen 3.5的小模型陣列亮出來：0.8B、2B、4B、9B，主打能在更輕的設(shè)備上跑、用更少算力擠出更高的“智能密度”。更戲劇的是，埃隆·馬斯克還在X上留言夸“impressive intelligence density”。這類外部認可，本來是團隊最該慶祝的時刻。

結(jié)果不到一天，“我卸任了”。

這一消息迅速席卷了國內(nèi)AI行業(yè)，幾乎所有人都在追問其離職的原因。之所以引發(fā)如此巨大的震動，是因為在林俊旸推文下，千問核心成員Chen Cheng轉(zhuǎn)發(fā)并留言稱自己“心碎”，并表示“我知道離開并非你的選擇”。這一表態(tài)迅速被外界解讀為：離任背后或存在組織與管理層面的原因，而不僅僅是個人職業(yè)選擇。

截至目前，當事人并未對外給出完整解釋；但圍繞這次“突然卸任”，正如Hugging Face亞太區(qū)生態(tài)系統(tǒng)負責人王鐵震所言：林俊旸的離職對通義千問項目而言是“巨大損失”。而在模型競爭愈發(fā)激烈的當下，行業(yè)里最集中的猜測，主要落在兩件事：組織怎么改、方向往哪兒走。

架構(gòu)調(diào)整引爆矛盾？

先說最像“導火索”的那根線：組織架構(gòu)。

不少相關(guān)分析都認為這是兩方矛盾爆發(fā)的根源。這也是為什么在3月4日中午左右的內(nèi)部溝通會上，高層把重點放在“這是擴張、不是收縮”，并承認在組織溝通上存在不足。

之所以會出現(xiàn)這樣的情況，根源其實就在于組織架構(gòu)到底應該是垂直還是水平整合。

如果整理林俊旸的相關(guān)公開發(fā)言，可以發(fā)現(xiàn)他曾在多個不同場合多次提到：預訓練、后訓練乃至Infra（基礎(chǔ)架構(gòu)，在AI領(lǐng)域一般指支撐AI應用從開發(fā)、訓練、部署到運行的所有底層技術(shù)和工具的總稱）與訓練團隊需要更緊密的協(xié)作與溝通，以提升端到端能力迭代效率。

在這個層級的最上層，林俊旸直接負責的Qwen（通義千問）團隊隸屬于阿里云CTO周靖人負責的通義實驗室，但就在近期，通義實驗室計劃將千問團隊分拆。雖然這些團隊仍隸屬通義實驗室，但這依舊會使得組織架構(gòu)從涵蓋不同訓練流程和模態(tài)的“垂直整合”體系，變成預訓練、后訓練、文本、多模態(tài)等分開的水平分工團隊。

針對這次調(diào)整，阿里巴巴首席人才官蔣芳也承認溝通存在不足：“我們在快速發(fā)展，這波調(diào)整是為了擴充更多人才、提供更多資源。這次組織形式?jīng)]溝通好，新人引入肯定會帶來陣型變化，擴大過程中必然涉及到這些，我們可能沒處理好。”

這類調(diào)整并不罕見，大廠里也常見，不可否認的是，包括字節(jié)、谷歌這些大廠的組織架構(gòu)幾乎都是水平分工團隊，這也從某種程度上證明了水平分工團隊有其獨特的優(yōu)勢區(qū)間。從某種程度上來說，現(xiàn)階段大模型的訓練發(fā)展正朝著工業(yè)化方向邁進，水平分工的工業(yè)化效率會更高，也更適合商業(yè)化團隊。

但水平分工也并非沒有壞處，從員工角度來看，這樣的組織架構(gòu)很容易出現(xiàn)各個分組有不同KPI，最終導致整體協(xié)作能力降低。

畢竟，歷來大廠跨部門合作都是極大的難點。幾乎所有大廠員工可能都經(jīng)歷過：一旦想要其他部門的員工花時間幫你完成任務，就意味著你大概率要找對方的直屬領(lǐng)導，甚至兩個部門員工共同的大領(lǐng)導才能推進工作。員工要推進一個端到端優(yōu)化，很可能要跨多個組拉齊節(jié)奏。甚至最終導致每個分組都有自己的KPI，最終導致“誰為整體結(jié)果負責”這件事變得更加模糊。

于是，在兩廂取舍之下，阿里選擇了更適合擴張和商業(yè)化的水平整合，而不是繼續(xù)沿用林俊旸更看好的垂直整合模式。

這種矛盾很快被互聯(lián)網(wǎng)加工成：林俊旸是被迫離職的“悲情功臣”。而逼林俊旸出走的手段，就是用DAU來當作千問新一年的KPI。這則傳言最初的源頭來自卡內(nèi)基梅隆大學InfiniAI實驗室和Catalyst（一個跨學科的機器學習與系統(tǒng)研究團隊，人員基本由卡內(nèi)基梅隆大學的研究人員構(gòu)成）的博士生Xinyu Yang。

這種傳言雖然從邏輯上來說確實沒問題，畢竟讓基礎(chǔ)模型研究的團隊用考核App的標準做KPI，是個人可能都會不滿。加上最近千問在經(jīng)過一系列營銷活動后，日活依舊和豆包有巨大的差距（豆包已有僅2億日活，目前千問約為7000萬），用DAU做考核確實符合“外行指導內(nèi)行”的想象，由此該傳言自然變成了流傳最廣的版本。

隨后，大量媒體引用了這一觀點，加上開篇提到的核心成員Chen Cheng的發(fā)言，一時之間，DAU作KPI逼走往日工程的傳言甚囂塵上，風頭一時無二。但情況真得是這樣嗎？

但根據(jù)Morkeing的多方求證后，基本可以確定這是大概率是不實消息。

首先要說明的是，此前林俊旸負責的Qwen團隊隸屬于阿里云 CTO 周靖人負責的通義實驗室，確實承擔著大模型技術(shù)研發(fā)的核心職責，如今的千問APP也最早出自這一部門。但是阿里為了進軍C端，先是將“AI超級框”夸克定位為AI旗艦應用，此后又將千問APP并入脫胎自原夸克所在AIDC部門的千問事業(yè)群，在千問APP內(nèi)接入電商、外賣、導航等功能。

因此，即使以DAU作為考核KPI，這也應該是AIDC部門的千問事業(yè)群的KPI而非Qwen團隊。

其次，幾位近千問團隊的人士對Morketing表示，即使是商業(yè)化層面，今年千問的商業(yè)化的KPI也是MaaS（模型即服務）收入，而非DAU。

而這則揭開了雙方之間最根本的思路不同——到底是技術(shù)推動商業(yè)發(fā)展，還是以商業(yè)化為核心推動技術(shù)發(fā)展。

商業(yè)與技術(shù)，

到底誰才是推動者

根據(jù)相關(guān)受訪者的言論來看，管理層和林俊旸之間也存在著明顯的決策差異：公司管理層更看重旗艦模型的能力，而不是千問目前發(fā)展較好的小尺寸模型，因此其考核標準也更偏向考核旗艦模型的能力。

然而，現(xiàn)階段，如果將千問作為一個開源產(chǎn)品來看待，它毫無疑問是成功的。無論是從相對專業(yè)的測試還是業(yè)內(nèi)人士的評價來看，在小尺寸LLM（大語言模型）領(lǐng)域，千問都是毫無疑問的王者水平。無論是Z-image、Qwen-image還是通義萬相（Wan）系列視頻生成模型，都處于業(yè)內(nèi)領(lǐng)先水平。

這意味著，如果只考慮個人使用和本地化部署，千問確實是現(xiàn)階段小尺寸LLM里的最優(yōu)解。

但說實話，千問的旗艦模型相比之下，就顯得多少有點差強人意，無論是Qwen-Plus還是Max，幾乎很難和同時期的DeepSeek一較高下。與業(yè)內(nèi)大多數(shù)優(yōu)秀模型對比只能說是勉強沒有掉隊，但大概率不是最優(yōu)解。如果具體到某些特定領(lǐng)域，例如coding（編程）、生成圖片和生成視頻的能力，更是難與時下領(lǐng)先的產(chǎn)品一較高下。

但就像上文提到的今年千問的商業(yè)化的KPI是MaaS收入。顯然，集團是希望千問能夠在2026年迅速完成商業(yè)化的。

這點從今年紅包大戰(zhàn)上就已經(jīng)能夠看見端倪。相比其他家?guī)缀醵贾皇窃贏I領(lǐng)域占位，千問是為數(shù)不多給自己框定了相當明確使用場景的大模型，例如讓用戶點外賣，淘寶購物。

除此之外，一位曾經(jīng)嘗試過使用不同大模型API做測試的用戶也向Morketing表示，自己注冊過多個不同平臺做測試，只有通義是注冊完不久之后就有銷售打電話來詢問他的訴求，甚至在近期調(diào)用已經(jīng)很久不用的千問API后，對方銷售也迅速打電話來詢問使用情況。

這一系列的事件，無一不在證明集團對于商業(yè)化的迫切訴求。然而這恰恰是雙方對于大模型研發(fā)的邏輯差異所在。

對于林俊旸而言，在現(xiàn)階段，大模型轉(zhuǎn)應用的未來并不明確的情況下，他大概是期望通過小尺寸LLM打磨團隊開發(fā)能力，同時通過開源獲得社區(qū)反饋，從而反哺模型訓練。并且即使未來產(chǎn)品真的要商業(yè)化，千問全尺寸、全模態(tài)的模型路線可以讓很多企業(yè)、學校的技術(shù)從業(yè)者能夠很快選用到適合自己的模型，建立了好口碑。在這些模型落到生產(chǎn)環(huán)境后，很多企業(yè)主也會傾向于購買千問的模型服務，從而在模型成熟后快速推動商業(yè)化進程。

其邏輯的核心是用技術(shù)進步推動商業(yè)發(fā)展。

然而，從公司的角度來說，這套邏輯顯然并不容易被接受，一方面開源軟件的商業(yè)邏輯很難論證，這是幾乎所有開源軟件長期都在面臨的問題，國內(nèi)外都如此——Meta花了數(shù)十億美元訓練的開源大模型Llama，外界至今都還在爭論這筆賬究竟該怎么算，而且Llama也確實沒能在財報上為Meta添磚加瓦。

與之相反，當Google大范圍禁止工作人員發(fā)表大模型的相關(guān)論文后，雖然公司內(nèi)部產(chǎn)生了不少反對聲音，但隨著Gemini的不斷迭代，Google母公司的股價反而在穩(wěn)定上升。

這對于阿里而言，幾乎是只有一個答案的選擇題，隨著現(xiàn)如今字節(jié)旗下的豆包已然接近2億日活大關(guān)，還有尚未完全發(fā)力的騰訊在后方虎視眈眈，這就意味著阿里自家的旗艦模型關(guān)系的已經(jīng)不再是一個小問題，而是關(guān)系阿里云的商業(yè)化閉環(huán)，以及整個阿里集團的未來的重要決策。

這使得基于商業(yè)化需求推動技術(shù)革命，就成了阿里目前最好的選擇。

于是，對于集團高層管理而言，如何快速的將大模型真正意義上商用，自然就成了眼下最著急的任務，畢竟股價、市場預期都在背后推動商業(yè)化的訴求，而大模型是否能夠快速商用，旗艦模型的重要性不言而喻。

也正因此，雙方對于商業(yè)化的急切程度明顯不同，導致了研發(fā)思路完全不同，最終矛盾演變成了雙方的分道揚鑣。

大廠AI掌門人離職，

似乎已經(jīng)成了行業(yè)規(guī)律

從某種程度上來說，AI掌門人的離職幾乎成了一種必然的宿命。

技術(shù)與商業(yè)化似乎天然存在一個悖論：技術(shù)負責人往往有著理想主義者的光輝，他們希望通過技術(shù)推動商業(yè)化變革，用技術(shù)改變世界。與之相對，科技企業(yè)卻更希望通過商業(yè)化推動技術(shù)革新，認為技術(shù)只有為商業(yè)服務才有價值。

雖然人們總是說金錢是改變世界的附贈品，賺錢是技術(shù)革新的必然，但對于上市公司而言，追求穩(wěn)定、有效幾乎是一條必然路徑。

之所以這么說，是因為如果將林俊旸的離職置于更廣闊的視野下，我們會發(fā)現(xiàn)這是一場跨國界、跨公司的共同問題。百度曾經(jīng)的吳恩達，也在科研向產(chǎn)品化的轉(zhuǎn)型中離職；OpenAI內(nèi)部核心成員如Ilya Sutskever，也在安全與商業(yè)、理想與現(xiàn)實的終極對抗中離開。即使是現(xiàn)如今日活最高的豆包，字節(jié)跳動的AI相關(guān)負責人也經(jīng)歷過多次更迭。

雖然目前我們尚不清楚林俊旸的下一步去向，也不清楚這次人事變動會對通義千問的未來發(fā)展產(chǎn)生何種影響，但核心人物的離職對于AI行業(yè)而言再正常不過。只不過在全球AI軍備競賽的關(guān)鍵節(jié)點，千問能不能押準未來，用自己的工業(yè)化能力走出失去核心技術(shù)負責人的陰霾，并找到屬于自己的位置，才是決定千問未來的核心關(guān)鍵。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.