![]()
新智元報道
編輯:傾傾
【新智元導讀】OpenAI的人才地震還在繼續(xù)!剛剛,前研究副總裁Max Schwarzer宣布離職,這位親手主導o1、o3和整個GPT-5系列post-training的核心人物,選擇加入Anthropic,重返一線RL研究。
心態(tài)崩了!OpenAI又走了一個重量級人物。
剛剛,前研究副總裁Max Schwarzer在X上發(fā)文,宣布正式離開OpenAI,轉(zhuǎn)投Anthropic。
![]()
他在OpenAI主導整個post-training團隊,親手參與訓練了o1、o3,以及GPT-5、5.1、5.2、5.3-Codex全系列模型。
但他不是被挖走的,是自己主動選擇走的,理由是「渴望回歸一線IC研究工作」。
這個選擇,比離職本身更耐人尋味。
他親歷了o1的誕生
在AI圈,Max Schwarzer算不上家喻戶曉,但他的履歷相當拿得出手。
![]()
2024年3月,他在蒙特利爾人工智能研究院Mila完成博士答辯,導師是強化學習領(lǐng)域的兩位重量級人物:Aaron Courville和Marc Bellemare。
博士期間,他的研究聚焦在「規(guī)模化與樣本高效強化學習」的交叉地帶。
通俗來說,就是怎么讓RL訓練既強又省。
他在2023年ICML發(fā)表的論文拿下了當年的頂會獎項,證明了不依賴LLM或世界模型,純靠擴展無模型RL就能達到人類水平的樣本效率。
![]()
論文傳送門:https://arxiv.org/abs/2305.19452
但真正讓他進入OpenAI核心圈的,是他對推理的判斷。
2024年9月12日,o1-preview發(fā)布當天,他發(fā)帖說這是「推理時代的開端」。
他是OpenAI o1的核心貢獻者之一,參與了「草莓團隊」(Strawberry team)的RL算法開發(fā),o1-preview的早期去風險化實驗更是出自他手。
之后,他主導了o1和o3的post-training,2025年3月晉升為研究副總裁,領(lǐng)導整個post-training團隊,負責打磨GPT-5系列。
從應屆博士生入職,他用不到兩年半時間就坐上了研究VP的位置。
頂級VP:我只想回去做研究
離職聲明里都是對OpenAI的稱贊:「OpenAI有我見過的最有才華的一批研究員」「我學到的東西超出了我作為應屆畢業(yè)生時的想象」。
關(guān)于離職的真正的理由,他說:
領(lǐng)導了一年的post-training工作之后,我渴望重新出發(fā),回到IC研究崗位。我一直在認真考慮回歸技術(shù)研究這件事,而且我真心相信,我的同事和團隊在沒有我的情況下完全能夠繼續(xù)成功。
這句話值得細品。
IC研究,相對于管理角色來說,就是親手寫代碼、跑實驗;管理層負責管人、協(xié)調(diào)資源、做路線規(guī)劃。
對研究員來說,升得越高,離真正的研究越遠。
Schwarzer顯然不適應這種狀態(tài)。
他在OpenAI的最后一年,更多時間花在帶團隊、做決策上。
站在研究VP的位置上,他可以影響幾十人的研究方向,但自己動手的空間少了很多。
這種選擇在AI行業(yè)并不罕見,但肯做出這個選擇的人需要勇氣。
畢竟,「研究VP」的頭銜在任何簡歷上都足夠好看,放棄它回去當普通研究員,不是每個人都愿意的。
事實上,Schwarzer不是第一個從post-training主管位置出走的人。
他的前任Liam Fedus,同樣擔任過OpenAI研究副總裁兼post-training負責人,于2025年3月離職,隨后聯(lián)合創(chuàng)辦了AI初創(chuàng)公司Periodic Labs,目標是打造「AI科學家」。
![]()
從OpenAI離職的人前赴后繼,令人深思。
OpenAI的人才流失:不只是走了幾個人
Schwarzer是近兩年OpenAI人才出走潮中的最新一個,但絕對不是最后一個。
2025年以來,離開OpenAI的研究員和高管名單越來越長:前CTO Mira Murati、首席研究官Bob McGrew、研究副總裁Barret Zoph,在2024年集中離職。
2025年夏天,Jason Wei、Zhiqing Sun、Hyung Won Chung等多位研究科學家相繼跳槽Meta。
后者在LinkedIn上公開表示,很高興能「從一張白紙開始,與真正有才華密度的團隊共事」,言下之意耐人尋味。
![]()
到現(xiàn)在,Altman是OpenAI原始11人創(chuàng)始團隊中僅剩的兩位成員之一。
兩周前,CNN報道稱,一批AI研究員正在「邊走邊拉警報」。
OpenAI的一位研究員在離職時表示,這項技術(shù)「有以我們無法理解、更無法阻止的方式操縱用戶的潛力」。
![]()
OpenAI還在同一周因為反對推出成人模式而解雇了一名安全主管,并被曝解散了專注于確保AI對全人類有益的使命對齊團隊。
Schwarzer的離職聲明里沒有任何批評,反而充滿了對OpenAI的善意。
這種體面的分手,反而格外少見。
此時此刻的Anthropic
他選了Anthropic,崗位是RL研究,這個他最擅長的領(lǐng)域,不做管理,就做研究。
![]()
Anthropic近兩年持續(xù)吸引了來自OpenAI的頂尖人才。
2024年,對齊研究負責人Jan Leike、OpenAI聯(lián)合創(chuàng)始人John Schulman先后加入,前者明確表示是因為對OpenAI「沒有認真對待安全」的不滿。
2026年初,OpenAI的高級安全研究員Andrea Vallone也跳槽到Anthropic,在Jan Leike手下工作。
而Schwarzer加入的時間節(jié)點,格外微妙。
就在前幾天,Anthropic正經(jīng)歷它五年歷史中最大的一場風波:與五角大樓的正面交鋒。
Anthropic拒絕向國防部開放Claude用于大規(guī)模監(jiān)控或全自主武器的權(quán)限,特朗普隨即在Truth Social上命令所有聯(lián)邦機構(gòu)立即停用Anthropic的技術(shù)。
而與此同時,OpenAI迅速填補了這一真空,達成向五角大樓開放其模型的協(xié)議。
![]()
諷刺的是,在Anthropic最艱難的時刻,Claude在蘋果AppStore的下載量反而超過了ChatGPT,Anthropic的估值目前高達3800億美元。
Schwarzer在聲明結(jié)尾寫道:「我期待支持在這個重要時刻的朋友們。」
他說的重要時刻,大概不只是指Anthropic自身的研究進展。
Schwarzer選擇在這個節(jié)點加入,某種程度上是一次站隊。
正面臨最大危機的Anthropic,正在用一件事證明自己的吸引力:在商業(yè)壓力和安全底線之間,它選擇了后者,哪怕代價是失去整個聯(lián)邦政府的合同。
對于那些不缺錢、只缺使命感的頂級研究員而言,這種姿態(tài),比任何offer都有說服力。
參考資料:
https://x.com/max_a_schwarzer/status/2028939154944585989?s=20
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.