阿里大模型負責人離職后首曝：Qwen3那個開關，我們搞砸了

2026-03-27 14:32:51　來源: 固件更新中

北京舉報

分享至

昨天深夜，阿里千問技術(shù)負責人林俊旸在離職后首次公開發(fā)聲。他寫了一篇長文，題目很學術(shù)——《From "Reasoning" Thinking to "Agentic" Thinking》——但核心判斷很直白：大模型的下一波躍遷，不是靠把"思考時間"拉得更長，而是得學會一種新本事——為了干活而思考，邊干邊想，錯了就改。

他管這叫"智能體思維"。

文章里有個挺少見的自我復盤。2025年初，Qwen團隊想做一件聽起來很合理的事：把"深度思考模式"和"快答模式"合并到同一個模型里。理想很豐滿——模型自己判斷，什么問題秒回，什么問題值得多想想，什么難題該砸更多算力。Qwen3就是這個思路的產(chǎn)物，業(yè)內(nèi)首批搞"混合思維"的模型。

但林俊旸說，結(jié)果"并不理想"。

合并之后，深度思考變得啰嗦、猶豫；快答模式也不再干脆、穩(wěn)定、便宜。問題不在模型開關，在數(shù)據(jù)——兩種模式要的東西不一樣，硬湊在一起不是取長補短，是兩頭受損。這有點像把馬拉松選手和短跑選手塞進同一套訓練計劃，最后誰都沒練出來。

這個失敗讓他重新想了一件事：大模型最好的思考方式，到底是什么樣子？

他的答案，和Anthropic的路線對上了。Claude 3.7讓用戶控制"思考預算"，Claude 4允許邊想邊用工具。核心不是輸出更長的內(nèi)心獨白，是讓思考真正服務于寫代碼、調(diào)工具、干長活。換句話說，思考的質(zhì)量不由長度定義，而由它幫你在環(huán)境里推進了多少事來定義。

林俊旸把這個轉(zhuǎn)變概括為：從"推理思維"走向"智能體思維"。

前者是靜態(tài)的、內(nèi)部的、一個人悶頭想；后者是開放的、交互的、在行動里持續(xù)修正。未來的強模型，得能處理一類純推理模型搞不定的問題：工具怎么用、環(huán)境怎么感知、計劃怎么調(diào)整、多步任務怎么推進——這些正是最近被熱議的"Harness Engineering"要解決的。

他判斷，智能體能力的核心，越來越不只在模型本身，而在那套"腳手架"——環(huán)境、工具、約束、反饋循環(huán)、多智能體協(xié)作。Harness Engineering的價值，就是把一個"裸模型"變成能在現(xiàn)實任務里持續(xù)干活的Agent。

競爭焦點也在轉(zhuǎn)移。推理時代，比的是強化學習算法、反饋信號、訓練流水線；智能體時代，比的是誰能建出更好的環(huán)境、更緊密的訓推協(xié)同、更強的Harness Engineering，以及誰能真正把模型決策和現(xiàn)實后果閉環(huán)起來。

文章最后，林俊旸提到Qwen團隊已經(jīng)明確寫過："我們正在從一個專注于訓練模型的時代，轉(zhuǎn)向一個以訓練智能體為中心的時代。"而那個讓他走人的"混合思維"實驗，現(xiàn)在看更像是一次必要的彎路——它證明了"合并"不能是粗暴拼接，得讓推理強度變成平滑光譜，讓模型自適應選擇，讓思考真正嵌入行動。

至于Qwen3之后的產(chǎn)品線，2025年下半年已經(jīng)拆成了獨立的Instruct和Thinking更新。商業(yè)客戶要的是快、便宜、可控；合并對他們來說，未必是禮物。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.