![]()
![]()
文 | Innocent Roland
2026年3月4日凌晨,阿里巴巴通義千問(Qwen)技術(shù)負責人林俊旸在社交媒體X(原推特)上發(fā)布了一條簡短的推文:“me stepping down. bye my beloved qwen”(我要卸任了。再見,我親愛的Qwen)。
然而就在前兩天,Qwen剛把Qwen 3.5的小模型陣列亮出來:0.8B、2B、4B、9B,主打能在更輕的設(shè)備上跑、用更少算力擠出更高的“智能密度”。更戲劇的是,埃隆·馬斯克還在X上留言夸“impressive intelligence density”。這類外部認可,本來是團隊最該慶祝的時刻。
結(jié)果不到一天,“我卸任了”。
這一消息迅速席卷了國內(nèi)AI行業(yè),幾乎所有人都在追問其離職的原因。之所以引發(fā)如此巨大的震動,是因為在林俊旸推文下,千問核心成員Chen Cheng轉(zhuǎn)發(fā)并留言稱自己“心碎”,并表示“我知道離開并非你的選擇”。這一表態(tài)迅速被外界解讀為:離任背后或存在組織與管理層面的原因,而不僅僅是個人職業(yè)選擇。
截至目前,當事人并未對外給出完整解釋;但圍繞這次“突然卸任”,正如Hugging Face亞太區(qū)生態(tài)系統(tǒng)負責人王鐵震所言:林俊旸的離職對通義千問項目而言是“巨大損失”。而在模型競爭愈發(fā)激烈的當下,行業(yè)里最集中的猜測,主要落在兩件事:組織怎么改、方向往哪兒走。
![]()
架構(gòu)調(diào)整引爆矛盾?
先說最像“導火索”的那根線:組織架構(gòu)。
不少相關(guān)分析都認為這是兩方矛盾爆發(fā)的根源。這也是為什么在3月4日中午左右的內(nèi)部溝通會上,高層把重點放在“這是擴張、不是收縮”,并承認在組織溝通上存在不足。
之所以會出現(xiàn)這樣的情況,根源其實就在于組織架構(gòu)到底應該是垂直還是水平整合。
如果整理林俊旸的相關(guān)公開發(fā)言,可以發(fā)現(xiàn)他曾在多個不同場合多次提到:預訓練、后訓練乃至Infra(基礎(chǔ)架構(gòu),在AI領(lǐng)域一般指支撐AI應用從開發(fā)、訓練、部署到運行的所有底層技術(shù)和工具的總稱)與訓練團隊需要更緊密的協(xié)作與溝通,以提升端到端能力迭代效率。
在這個層級的最上層,林俊旸直接負責的Qwen(通義千問)團隊隸屬于阿里云CTO周靖人負責的通義實驗室,但就在近期,通義實驗室計劃將千問團隊分拆。雖然這些團隊仍隸屬通義實驗室,但這依舊會使得組織架構(gòu)從涵蓋不同訓練流程和模態(tài)的“垂直整合”體系,變成預訓練、后訓練、文本、多模態(tài)等分開的水平分工團隊。
針對這次調(diào)整,阿里巴巴首席人才官蔣芳也承認溝通存在不足:“我們在快速發(fā)展,這波調(diào)整是為了擴充更多人才、提供更多資源。這次組織形式?jīng)]溝通好,新人引入肯定會帶來陣型變化,擴大過程中必然涉及到這些,我們可能沒處理好。”
這類調(diào)整并不罕見,大廠里也常見,不可否認的是,包括字節(jié)、谷歌這些大廠的組織架構(gòu)幾乎都是水平分工團隊,這也從某種程度上證明了水平分工團隊有其獨特的優(yōu)勢區(qū)間。從某種程度上來說,現(xiàn)階段大模型的訓練發(fā)展正朝著工業(yè)化方向邁進,水平分工的工業(yè)化效率會更高,也更適合商業(yè)化團隊。
但水平分工也并非沒有壞處,從員工角度來看,這樣的組織架構(gòu)很容易出現(xiàn)各個分組有不同KPI,最終導致整體協(xié)作能力降低。
畢竟,歷來大廠跨部門合作都是極大的難點。幾乎所有大廠員工可能都經(jīng)歷過:一旦想要其他部門的員工花時間幫你完成任務,就意味著你大概率要找對方的直屬領(lǐng)導,甚至兩個部門員工共同的大領(lǐng)導才能推進工作。員工要推進一個端到端優(yōu)化,很可能要跨多個組拉齊節(jié)奏。甚至最終導致每個分組都有自己的KPI,最終導致“誰為整體結(jié)果負責”這件事變得更加模糊。
于是,在兩廂取舍之下,阿里選擇了更適合擴張和商業(yè)化的水平整合,而不是繼續(xù)沿用林俊旸更看好的垂直整合模式。
這種矛盾很快被互聯(lián)網(wǎng)加工成:林俊旸是被迫離職的“悲情功臣”。而逼林俊旸出走的手段,就是用DAU來當作千問新一年的KPI。這則傳言最初的源頭來自卡內(nèi)基梅隆大學InfiniAI實驗室和Catalyst(一個跨學科的機器學習與系統(tǒng)研究團隊,人員基本由卡內(nèi)基梅隆大學的研究人員構(gòu)成)的博士生Xinyu Yang。
![]()
這種傳言雖然從邏輯上來說確實沒問題,畢竟讓基礎(chǔ)模型研究的團隊用考核App的標準做KPI,是個人可能都會不滿。加上最近千問在經(jīng)過一系列營銷活動后,日活依舊和豆包有巨大的差距(豆包已有僅2億日活,目前千問約為7000萬),用DAU做考核確實符合“外行指導內(nèi)行”的想象,由此該傳言自然變成了流傳最廣的版本。
隨后,大量媒體引用了這一觀點,加上開篇提到的核心成員Chen Cheng的發(fā)言,一時之間,DAU作KPI逼走往日工程的傳言甚囂塵上,風頭一時無二。但情況真得是這樣嗎?
但根據(jù)Morkeing的多方求證后,基本可以確定這是大概率是不實消息。
首先要說明的是,此前林俊旸負責的Qwen團隊隸屬于阿里云 CTO 周靖人負責的通義實驗室,確實承擔著大模型技術(shù)研發(fā)的核心職責,如今的千問APP也最早出自這一部門。 但是阿里為了進軍C端,先是將“AI超級框”夸克定位為AI旗艦應用,此后又將千問APP并入脫胎自原夸克所在AIDC部門的千問事業(yè)群,在千問APP內(nèi)接入電商、外賣、導航等功能。
因此,即使以DAU作為考核KPI,這也應該是AIDC部門的千問事業(yè)群的KPI而非Qwen團隊。
其次,幾位近千問團隊的人士對Morketing表示,即使是商業(yè)化層面,今年千問的商業(yè)化的KPI也是MaaS(模型即服務)收入,而非DAU。
而這則揭開了雙方之間最根本的思路不同——到底是技術(shù)推動商業(yè)發(fā)展,還是以商業(yè)化為核心推動技術(shù)發(fā)展。
![]()
商業(yè)與技術(shù),
到底誰才是推動者
根據(jù)相關(guān)受訪者的言論來看,管理層和林俊旸之間也存在著明顯的決策差異:公司管理層更看重旗艦模型的能力,而不是千問目前發(fā)展較好的小尺寸模型,因此其考核標準也更偏向考核旗艦模型的能力。
然而,現(xiàn)階段,如果將千問作為一個開源產(chǎn)品來看待,它毫無疑問是成功的。無論是從相對專業(yè)的測試還是業(yè)內(nèi)人士的評價來看,在小尺寸LLM(大語言模型)領(lǐng)域,千問都是毫無疑問的王者水平。無論是Z-image、Qwen-image還是通義萬相(Wan)系列視頻生成模型,都處于業(yè)內(nèi)領(lǐng)先水平。
這意味著,如果只考慮個人使用和本地化部署,千問確實是現(xiàn)階段小尺寸LLM里的最優(yōu)解。
但說實話,千問的旗艦模型相比之下,就顯得多少有點差強人意,無論是Qwen-Plus還是Max,幾乎很難和同時期的DeepSeek一較高下。與業(yè)內(nèi)大多數(shù)優(yōu)秀模型對比只能說是勉強沒有掉隊,但大概率不是最優(yōu)解。如果具體到某些特定領(lǐng)域,例如coding(編程)、生成圖片和生成視頻的能力,更是難與時下領(lǐng)先的產(chǎn)品一較高下。
但就像上文提到的今年千問的商業(yè)化的KPI是MaaS收入。顯然,集團是希望千問能夠在2026年迅速完成商業(yè)化的。
這點從今年紅包大戰(zhàn)上就已經(jīng)能夠看見端倪。相比其他家?guī)缀醵贾皇窃贏I領(lǐng)域占位,千問是為數(shù)不多給自己框定了相當明確使用場景的大模型,例如讓用戶點外賣,淘寶購物。
除此之外,一位曾經(jīng)嘗試過使用不同大模型API做測試的用戶也向Morketing表示,自己注冊過多個不同平臺做測試,只有通義是注冊完不久之后就有銷售打電話來詢問他的訴求,甚至在近期調(diào)用已經(jīng)很久不用的千問API后,對方銷售也迅速打電話來詢問使用情況。
這一系列的事件,無一不在證明集團對于商業(yè)化的迫切訴求。然而這恰恰是雙方對于大模型研發(fā)的邏輯差異所在。
對于林俊旸而言,在現(xiàn)階段,大模型轉(zhuǎn)應用的未來并不明確的情況下,他大概是期望通過小尺寸LLM打磨團隊開發(fā)能力,同時通過開源獲得社區(qū)反饋,從而反哺模型訓練。并且即使未來產(chǎn)品真的要商業(yè)化,千問全尺寸、全模態(tài)的模型路線可以讓很多企業(yè)、學校的技術(shù)從業(yè)者能夠很快選用到適合自己的模型,建立了好口碑。在這些模型落到生產(chǎn)環(huán)境后,很多企業(yè)主也會傾向于購買千問的模型服務,從而在模型成熟后快速推動商業(yè)化進程。
其邏輯的核心是用技術(shù)進步推動商業(yè)發(fā)展。
然而,從公司的角度來說,這套邏輯顯然并不容易被接受,一方面開源軟件的商業(yè)邏輯很難論證,這是幾乎所有開源軟件長期都在面臨的問題,國內(nèi)外都如此——Meta花了數(shù)十億美元訓練的開源大模型Llama,外界至今都還在爭論這筆賬究竟該怎么算,而且Llama也確實沒能在財報上為Meta添磚加瓦。
與之相反,當Google大范圍禁止工作人員發(fā)表大模型的相關(guān)論文后,雖然公司內(nèi)部產(chǎn)生了不少反對聲音,但隨著Gemini的不斷迭代,Google母公司的股價反而在穩(wěn)定上升。
這對于阿里而言,幾乎是只有一個答案的選擇題,隨著現(xiàn)如今字節(jié)旗下的豆包已然接近2億日活大關(guān),還有尚未完全發(fā)力的騰訊在后方虎視眈眈,這就意味著阿里自家的旗艦模型關(guān)系的已經(jīng)不再是一個小問題,而是關(guān)系阿里云的商業(yè)化閉環(huán),以及整個阿里集團的未來的重要決策。
這使得基于商業(yè)化需求推動技術(shù)革命,就成了阿里目前最好的選擇。
于是,對于集團高層管理而言,如何快速的將大模型真正意義上商用,自然就成了眼下最著急的任務,畢竟股價、市場預期都在背后推動商業(yè)化的訴求,而大模型是否能夠快速商用,旗艦模型的重要性不言而喻。
也正因此,雙方對于商業(yè)化的急切程度明顯不同,導致了研發(fā)思路完全不同,最終矛盾演變成了雙方的分道揚鑣。
![]()
大廠AI掌門人離職,
似乎已經(jīng)成了行業(yè)規(guī)律
從某種程度上來說,AI掌門人的離職幾乎成了一種必然的宿命。
技術(shù)與商業(yè)化似乎天然存在一個悖論:技術(shù)負責人往往有著理想主義者的光輝,他們希望通過技術(shù)推動商業(yè)化變革,用技術(shù)改變世界。與之相對,科技企業(yè)卻更希望通過商業(yè)化推動技術(shù)革新,認為技術(shù)只有為商業(yè)服務才有價值。
雖然人們總是說金錢是改變世界的附贈品,賺錢是技術(shù)革新的必然,但對于上市公司而言,追求穩(wěn)定、有效幾乎是一條必然路徑。
之所以這么說,是因為如果將林俊旸的離職置于更廣闊的視野下,我們會發(fā)現(xiàn)這是一場跨國界、跨公司的共同問題。百度曾經(jīng)的吳恩達,也在科研向產(chǎn)品化的轉(zhuǎn)型中離職;OpenAI內(nèi)部核心成員如Ilya Sutskever,也在安全與商業(yè)、理想與現(xiàn)實的終極對抗中離開。即使是現(xiàn)如今日活最高的豆包,字節(jié)跳動的AI相關(guān)負責人也經(jīng)歷過多次更迭。
雖然目前我們尚不清楚林俊旸的下一步去向,也不清楚這次人事變動會對通義千問的未來發(fā)展產(chǎn)生何種影響,但核心人物的離職對于AI行業(yè)而言再正常不過。只不過在全球AI軍備競賽的關(guān)鍵節(jié)點,千問能不能押準未來,用自己的工業(yè)化能力走出失去核心技術(shù)負責人的陰霾,并找到屬于自己的位置,才是決定千問未來的核心關(guān)鍵。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.