![]()
昨天深夜,阿里千問技術(shù)負責人林俊旸在離職后首次公開發(fā)聲。他寫了一篇長文,題目很學術(shù)——《From "Reasoning" Thinking to "Agentic" Thinking》——但核心判斷很直白:大模型的下一波躍遷,不是靠把"思考時間"拉得更長,而是得學會一種新本事——為了干活而思考,邊干邊想,錯了就改。
他管這叫"智能體思維"。
文章里有個挺少見的自我復盤。2025年初,Qwen團隊想做一件聽起來很合理的事:把"深度思考模式"和"快答模式"合并到同一個模型里。理想很豐滿——模型自己判斷,什么問題秒回,什么問題值得多想想,什么難題該砸更多算力。Qwen3就是這個思路的產(chǎn)物,業(yè)內(nèi)首批搞"混合思維"的模型。
但林俊旸說,結(jié)果"并不理想"。
合并之后,深度思考變得啰嗦、猶豫;快答模式也不再干脆、穩(wěn)定、便宜。問題不在模型開關,在數(shù)據(jù)——兩種模式要的東西不一樣,硬湊在一起不是取長補短,是兩頭受損。這有點像把馬拉松選手和短跑選手塞進同一套訓練計劃,最后誰都沒練出來。
這個失敗讓他重新想了一件事:大模型最好的思考方式,到底是什么樣子?
他的答案,和Anthropic的路線對上了。Claude 3.7讓用戶控制"思考預算",Claude 4允許邊想邊用工具。核心不是輸出更長的內(nèi)心獨白,是讓思考真正服務于寫代碼、調(diào)工具、干長活。換句話說,思考的質(zhì)量不由長度定義,而由它幫你在環(huán)境里推進了多少事來定義。
林俊旸把這個轉(zhuǎn)變概括為:從"推理思維"走向"智能體思維"。
前者是靜態(tài)的、內(nèi)部的、一個人悶頭想;后者是開放的、交互的、在行動里持續(xù)修正。未來的強模型,得能處理一類純推理模型搞不定的問題:工具怎么用、環(huán)境怎么感知、計劃怎么調(diào)整、多步任務怎么推進——這些正是最近被熱議的"Harness Engineering"要解決的。
他判斷,智能體能力的核心,越來越不只在模型本身,而在那套"腳手架"——環(huán)境、工具、約束、反饋循環(huán)、多智能體協(xié)作。Harness Engineering的價值,就是把一個"裸模型"變成能在現(xiàn)實任務里持續(xù)干活的Agent。
競爭焦點也在轉(zhuǎn)移。推理時代,比的是強化學習算法、反饋信號、訓練流水線;智能體時代,比的是誰能建出更好的環(huán)境、更緊密的訓推協(xié)同、更強的Harness Engineering,以及誰能真正把模型決策和現(xiàn)實后果閉環(huán)起來。
文章最后,林俊旸提到Qwen團隊已經(jīng)明確寫過:"我們正在從一個專注于訓練模型的時代,轉(zhuǎn)向一個以訓練智能體為中心的時代。"而那個讓他走人的"混合思維"實驗,現(xiàn)在看更像是一次必要的彎路——它證明了"合并"不能是粗暴拼接,得讓推理強度變成平滑光譜,讓模型自適應選擇,讓思考真正嵌入行動。
至于Qwen3之后的產(chǎn)品線,2025年下半年已經(jīng)拆成了獨立的Instruct和Thinking更新。商業(yè)客戶要的是快、便宜、可控;合并對他們來說,未必是禮物。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.