3月26日,原阿里通義千問(Qwen)技術負責人林俊旸(Justin Lin)在社交平臺上發布了一篇題為“From ‘Reasoning’ Thinking to‘Agentic’ Thinking(從推理式思考到智能體思考)的文章長文。這是他自本月初從阿里辭職之后發布的第一篇長文。在這篇文章中,林俊旸系統性地復盤了推理模型階段的特征,并探討了AI未來的發展方向:從訓練模型轉向訓練智能體。
林俊旸表示,過去兩年重塑了行業對大模型的評估方式與核心期待。OpenAI 的 o1 表明,"思考"可以成為一種被訓練出來的能力。DeepSeek-R1 緊隨其后,證明推理式的后訓練可以在原始實驗室之外被復現、被擴展。這一階段至關重要。但 2025 年上半年,行業焦點主要停留在"推理式思考"本身:如何讓模型在推理的時候多想一會兒。現在該問下一步了。他的判斷是智能體式思考:為了行動而思考,在與環境交互的過程中,并根據來自世界的反饋持續更新計劃。
他提到,2025 年初,千問團隊有一個很大的野心:做一個統一的系統,讓思考模式和指令模式合二為一,支持可調節的推理努力程度(類似于低/中/高推理設置),甚至能根據提示詞和上下文自動推斷合適的推理量,讓模型自主決定何時直接回答、何時稍作思考、何時為真正困難的問題投入大量計算。概念上,這是正確的方向。但"合并"說起來容易,做好卻極難。
真正的難點在于數據。當人們談論合并思考與指令時,往往首先想到模型側的兼容性,更深層的問題是,兩種模式的數據分布和行為目標存在顯著差異。在嘗試平衡模型合并與提升后訓練數據質量和多樣性的過程中,團隊并未把所有事情都做對,結果往往是在兩個方向上都表現平庸:"思考"行為變得嘈雜、冗余或不夠果斷,而"指令"行為則變得不夠清晰、不夠可靠,且比商業用戶實際想要的成本更高。
分開做在實踐中仍然有吸引力。2025 年下半年,Qwen 的 2507 版本就發了獨立的 Instruct 和 Thinking 版本,30B 和 235B 各一套。而他的最終思考是,真正成功的合并需要一個平滑的推理力度光譜,模型能自己判斷該花多少力氣去想。
“推理鏈更長,不等于模型更聰明。很多時候,推理鏈越長,反而說明模型在亂花算力。”林俊旸在文中表示,他提到,千問團隊意識到,行業正在從訓練模型的時代,走向訓練智能體的時代,它的定義特征是跟真實世界的閉環交互。
智能體式思考和推理式思考,意味著不同的優化目標,推理式思考通常以最終答案前的內部思辨質量來評判:模型能否解出定理、寫出證明、生成正確代碼或通過基準測試。而智能體思維關注的是:模型能否在與環境交互的過程中持續取得進展。
這意味著,核心問題從“模型能否思考得足夠久?”轉變為“模型能不能用一種撐得起有效行動的方式來思考?”模型訓練的核心對象也隨之變了,變成了模型加環境的整個系統。
在這之中,模型架構和訓練數據當然還重要,但環境設計、rollout 基礎設施、評估器的穩健程度、多個 Agent 之間怎么協調,這些都進了核心圈。“好的思考”的定義也變了:在真實約束下最能撐起行動的那條軌跡,而非最長或最顯眼的那條。
林俊旸預測,智能體式思考會成為主流。
《科創板日報》3月4日訊,《科創板日報》記者注意到,3月4日下午,阿里千問大模型核心負責人林俊旸新發朋友圈表示:抱歉各位朋友,今天不回復消息和電話了,我真的需要休息。qwen 的兄弟們,按照原來安排繼續干,沒問題的。而就在昨日凌晨,林俊旸在社交媒體發文稱:me stepping down. bye my beloved qwen.(我卸任了。再見了,我親愛的千問。)
![]()
![]()
3月4日凌晨,阿里Qwen技術負責人林俊旸在社交平臺上與千問道別,稱“我退出了”。隨后,阿里巴巴通義實驗室科學家惠彬原(Binyuan Hui)轉發該條博文并表示自己也退出了千問。南都N視頻記者就此向阿里云方面求證,截至發稿尚無回復。
![]()
林俊旸在社交平臺上與千問道別。
![]()
惠彬原稱自己也退出了。
林俊旸系阿里千問模型的重要負責人。公開資料顯示,林俊旸1993年出生,畢業于北京大學,系阿里巴巴達摩院高級算法專家、阿里通義千問系列大模型技術負責人,主導開發了全球領先的開源大模型。他的研究領域包括自然語言處理和多模態表示學習,研究興趣集中于大規模語言模型和多模態大模型,曾在多個頂級會議發表多篇論文。公開信息顯示,林俊旸對通義千問的技術貢獻突出,如他主導開發Qwen3.0等模型性能超越Llama2-70B、首創多模態Agent框架,增強視覺/語音理解能力、推動構建中文社區最大開源模型生態體系等。
有業內人士猜測,林俊旸的離開或由于其考核目標變成了日活躍用戶數。對于林俊旸離開后誰會接任其位置,該業內人士也提到或是一位來自谷歌Gemini團隊、以日活躍用戶數(DAU)指標為導向的非核心人才。南都記者就此向阿里云方面求證,截至發稿尚無回復。
林俊旸與月之暗面創始人兼CEO楊植麟、騰訊首席AI科學家姚順雨和清華大學教授、智譜創始人兼首席科學家唐杰被在業內并稱“基模四杰”,其他幾位均為月之暗面、騰訊、智譜等企業的模型掌門人。
今年1月在中關村,林俊旸還提到,自己2021年做模型的時候,阿里芯片團隊的人來問自己三年后模型主流架構是不是Transformer和多模態,因為三年后模型才能流片。他表示,“三年之后,我在不在阿里巴巴,我都不知道。但最后我今天還在阿里巴巴,然后他果然還是Transformer,還是多模態,我就非常懊悔為什么當時沒有去催他去做。”
模型進展方面,3月3日,阿里巴巴再度開源4款小尺寸千問3.5系列模型。其中最小的0.8B和2B兩款,體積極小,推理速度極快,適合移動設備、IoT 邊緣設備部署,以及低延時的實時交互場景。據悉,四款Qwen3.5新模型雖是小尺寸,但均擁有原生多模態能力,以極小的參數量實現了極大的性能提升。模型發布后還迅速引來馬斯克在社交媒體上點贊評論,稱阿里千問模型“智能密度令人印象深刻”。
來源:澎湃新聞、第一財經、界面新聞、財聯社、南方都市報
【來源:瀟湘晨報】
報料、維權通道:應用市場下載“晨視頻”客戶端,搜索“報料”一鍵直達,或撥打熱線0731-85571188;如需內容合作,請撥打政企服務專席19176699651,商務合作聯系0731-85572288。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.