網易首頁 > 網易號 > 正文申請入駐

前阿里千問負責人林俊旸離職后首發長文，探討AI未來的發展方向：從訓練模型轉向訓練智能體

2026-03-27 15:15:36　來源: 瀟湘晨報

湖南舉報

分享至

3月26日，原阿里通義千問（Qwen）技術負責人林俊旸（Justin Lin）在社交平臺上發布了一篇題為“From ‘Reasoning’ Thinking to‘Agentic’ Thinking（從推理式思考到智能體思考）的文章長文。這是他自本月初從阿里辭職之后發布的第一篇長文。在這篇文章中，林俊旸系統性地復盤了推理模型階段的特征，并探討了AI未來的發展方向：從訓練模型轉向訓練智能體。

林俊旸表示，過去兩年重塑了行業對大模型的評估方式與核心期待。OpenAI 的 o1 表明，"思考"可以成為一種被訓練出來的能力。DeepSeek-R1 緊隨其后，證明推理式的后訓練可以在原始實驗室之外被復現、被擴展。這一階段至關重要。但 2025 年上半年，行業焦點主要停留在"推理式思考"本身：如何讓模型在推理的時候多想一會兒。現在該問下一步了。他的判斷是智能體式思考：為了行動而思考，在與環境交互的過程中，并根據來自世界的反饋持續更新計劃。

他提到，2025 年初，千問團隊有一個很大的野心：做一個統一的系統，讓思考模式和指令模式合二為一，支持可調節的推理努力程度（類似于低/中/高推理設置），甚至能根據提示詞和上下文自動推斷合適的推理量，讓模型自主決定何時直接回答、何時稍作思考、何時為真正困難的問題投入大量計算。概念上，這是正確的方向。但"合并"說起來容易，做好卻極難。

真正的難點在于數據。當人們談論合并思考與指令時，往往首先想到模型側的兼容性，更深層的問題是，兩種模式的數據分布和行為目標存在顯著差異。在嘗試平衡模型合并與提升后訓練數據質量和多樣性的過程中，團隊并未把所有事情都做對，結果往往是在兩個方向上都表現平庸："思考"行為變得嘈雜、冗余或不夠果斷，而"指令"行為則變得不夠清晰、不夠可靠，且比商業用戶實際想要的成本更高。

分開做在實踐中仍然有吸引力。2025 年下半年，Qwen 的 2507 版本就發了獨立的 Instruct 和 Thinking 版本，30B 和 235B 各一套。而他的最終思考是，真正成功的合并需要一個平滑的推理力度光譜，模型能自己判斷該花多少力氣去想。

“推理鏈更長，不等于模型更聰明。很多時候，推理鏈越長，反而說明模型在亂花算力。”林俊旸在文中表示，他提到，千問團隊意識到，行業正在從訓練模型的時代，走向訓練智能體的時代，它的定義特征是跟真實世界的閉環交互。

智能體式思考和推理式思考，意味著不同的優化目標，推理式思考通常以最終答案前的內部思辨質量來評判：模型能否解出定理、寫出證明、生成正確代碼或通過基準測試。而智能體思維關注的是：模型能否在與環境交互的過程中持續取得進展。

這意味著，核心問題從“模型能否思考得足夠久？”轉變為“模型能不能用一種撐得起有效行動的方式來思考？”模型訓練的核心對象也隨之變了，變成了模型加環境的整個系統。

在這之中，模型架構和訓練數據當然還重要，但環境設計、rollout 基礎設施、評估器的穩健程度、多個 Agent 之間怎么協調，這些都進了核心圈。“好的思考”的定義也變了：在真實約束下最能撐起行動的那條軌跡，而非最長或最顯眼的那條。

林俊旸預測，智能體式思考會成為主流。

《科創板日報》3月4日訊，《科創板日報》記者注意到，3月4日下午，阿里千問大模型核心負責人林俊旸新發朋友圈表示：抱歉各位朋友，今天不回復消息和電話了，我真的需要休息。qwen 的兄弟們，按照原來安排繼續干，沒問題的。而就在昨日凌晨，林俊旸在社交媒體發文稱：me stepping down. bye my beloved qwen.（我卸任了。再見了，我親愛的千問。）

3月4日凌晨，阿里Qwen技術負責人林俊旸在社交平臺上與千問道別，稱“我退出了”。隨后，阿里巴巴通義實驗室科學家惠彬原（Binyuan Hui）轉發該條博文并表示自己也退出了千問。南都N視頻記者就此向阿里云方面求證，截至發稿尚無回復。

林俊旸在社交平臺上與千問道別。

惠彬原稱自己也退出了。

林俊旸系阿里千問模型的重要負責人。公開資料顯示，林俊旸1993年出生，畢業于北京大學，系阿里巴巴達摩院高級算法專家、阿里通義千問系列大模型技術負責人，主導開發了全球領先的開源大模型。他的研究領域包括自然語言處理和多模態表示學習，研究興趣集中于大規模語言模型和多模態大模型，曾在多個頂級會議發表多篇論文。公開信息顯示，林俊旸對通義千問的技術貢獻突出，如他主導開發Qwen3.0等模型性能超越Llama2-70B、首創多模態Agent框架，增強視覺/語音理解能力、推動構建中文社區最大開源模型生態體系等。

有業內人士猜測，林俊旸的離開或由于其考核目標變成了日活躍用戶數。對于林俊旸離開后誰會接任其位置，該業內人士也提到或是一位來自谷歌Gemini團隊、以日活躍用戶數（DAU）指標為導向的非核心人才。南都記者就此向阿里云方面求證，截至發稿尚無回復。

林俊旸與月之暗面創始人兼CEO楊植麟、騰訊首席AI科學家姚順雨和清華大學教授、智譜創始人兼首席科學家唐杰被在業內并稱“基模四杰”，其他幾位均為月之暗面、騰訊、智譜等企業的模型掌門人。

今年1月在中關村，林俊旸還提到，自己2021年做模型的時候，阿里芯片團隊的人來問自己三年后模型主流架構是不是Transformer和多模態，因為三年后模型才能流片。他表示，“三年之后，我在不在阿里巴巴，我都不知道。但最后我今天還在阿里巴巴，然后他果然還是Transformer，還是多模態，我就非常懊悔為什么當時沒有去催他去做。”

模型進展方面，3月3日，阿里巴巴再度開源4款小尺寸千問3.5系列模型。其中最小的0.8B和2B兩款，體積極小，推理速度極快，適合移動設備、IoT 邊緣設備部署，以及低延時的實時交互場景。據悉，四款Qwen3.5新模型雖是小尺寸，但均擁有原生多模態能力，以極小的參數量實現了極大的性能提升。模型發布后還迅速引來馬斯克在社交媒體上點贊評論，稱阿里千問模型“智能密度令人印象深刻”。

來源：澎湃新聞、第一財經、界面新聞、財聯社、南方都市報

【來源：瀟湘晨報】

報料、維權通道：應用市場下載“晨視頻”客戶端，搜索“報料”一鍵直達，或撥打熱線0731-85571188；如需內容合作，請撥打政企服務專席19176699651，商務合作聯系0731-85572288。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.