網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

又走一個！OpenAI研究VP離職，轉(zhuǎn)投Anthropic做RL研究員

2026-03-05 11:10:22　來源: 新智元

北京舉報

分享至

新智元報道

編輯：傾傾

【新智元導讀】OpenAI的人才地震還在繼續(xù)！剛剛，前研究副總裁Max Schwarzer宣布離職，這位親手主導o1、o3和整個GPT-5系列post-training的核心人物，選擇加入Anthropic，重返一線RL研究。

心態(tài)崩了！OpenAI又走了一個重量級人物。

剛剛，前研究副總裁Max Schwarzer在X上發(fā)文，宣布正式離開OpenAI，轉(zhuǎn)投Anthropic。

他在OpenAI主導整個post-training團隊，親手參與訓練了o1、o3，以及GPT-5、5.1、5.2、5.3-Codex全系列模型。

但他不是被挖走的，是自己主動選擇走的，理由是「渴望回歸一線IC研究工作」。

這個選擇，比離職本身更耐人尋味。

他親歷了o1的誕生

在AI圈，Max Schwarzer算不上家喻戶曉，但他的履歷相當拿得出手。

2024年3月，他在蒙特利爾人工智能研究院Mila完成博士答辯，導師是強化學習領(lǐng)域的兩位重量級人物：Aaron Courville和Marc Bellemare。

博士期間，他的研究聚焦在「規(guī)模化與樣本高效強化學習」的交叉地帶。

通俗來說，就是怎么讓RL訓練既強又省。

他在2023年ICML發(fā)表的論文拿下了當年的頂會獎項，證明了不依賴LLM或世界模型，純靠擴展無模型RL就能達到人類水平的樣本效率。

論文傳送門：https://arxiv.org/abs/2305.19452

但真正讓他進入OpenAI核心圈的，是他對推理的判斷。

2024年9月12日，o1-preview發(fā)布當天，他發(fā)帖說這是「推理時代的開端」。

他是OpenAI o1的核心貢獻者之一，參與了「草莓團隊」（Strawberry team）的RL算法開發(fā)，o1-preview的早期去風險化實驗更是出自他手。

之后，他主導了o1和o3的post-training，2025年3月晉升為研究副總裁，領(lǐng)導整個post-training團隊，負責打磨GPT-5系列。

從應屆博士生入職，他用不到兩年半時間就坐上了研究VP的位置。

頂級VP：我只想回去做研究

離職聲明里都是對OpenAI的稱贊：「OpenAI有我見過的最有才華的一批研究員」「我學到的東西超出了我作為應屆畢業(yè)生時的想象」。

關(guān)于離職的真正的理由，他說：

領(lǐng)導了一年的post-training工作之后，我渴望重新出發(fā)，回到IC研究崗位。我一直在認真考慮回歸技術(shù)研究這件事，而且我真心相信，我的同事和團隊在沒有我的情況下完全能夠繼續(xù)成功。

這句話值得細品。

IC研究，相對于管理角色來說，就是親手寫代碼、跑實驗；管理層負責管人、協(xié)調(diào)資源、做路線規(guī)劃。

對研究員來說，升得越高，離真正的研究越遠。

Schwarzer顯然不適應這種狀態(tài)。

他在OpenAI的最后一年，更多時間花在帶團隊、做決策上。

站在研究VP的位置上，他可以影響幾十人的研究方向，但自己動手的空間少了很多。

這種選擇在AI行業(yè)并不罕見，但肯做出這個選擇的人需要勇氣。

畢竟，「研究VP」的頭銜在任何簡歷上都足夠好看，放棄它回去當普通研究員，不是每個人都愿意的。

事實上，Schwarzer不是第一個從post-training主管位置出走的人。

他的前任Liam Fedus，同樣擔任過OpenAI研究副總裁兼post-training負責人，于2025年3月離職，隨后聯(lián)合創(chuàng)辦了AI初創(chuàng)公司Periodic Labs，目標是打造「AI科學家」。

從OpenAI離職的人前赴后繼，令人深思。

OpenAI的人才流失：不只是走了幾個人

Schwarzer是近兩年OpenAI人才出走潮中的最新一個，但絕對不是最后一個。

2025年以來，離開OpenAI的研究員和高管名單越來越長：前CTO Mira Murati、首席研究官Bob McGrew、研究副總裁Barret Zoph，在2024年集中離職。

2025年夏天，Jason Wei、Zhiqing Sun、Hyung Won Chung等多位研究科學家相繼跳槽Meta。

后者在LinkedIn上公開表示，很高興能「從一張白紙開始，與真正有才華密度的團隊共事」，言下之意耐人尋味。

到現(xiàn)在，Altman是OpenAI原始11人創(chuàng)始團隊中僅剩的兩位成員之一。

兩周前，CNN報道稱，一批AI研究員正在「邊走邊拉警報」。

OpenAI的一位研究員在離職時表示，這項技術(shù)「有以我們無法理解、更無法阻止的方式操縱用戶的潛力」。

OpenAI還在同一周因為反對推出成人模式而解雇了一名安全主管，并被曝解散了專注于確保AI對全人類有益的使命對齊團隊。

Schwarzer的離職聲明里沒有任何批評，反而充滿了對OpenAI的善意。

這種體面的分手，反而格外少見。

此時此刻的Anthropic

他選了Anthropic，崗位是RL研究，這個他最擅長的領(lǐng)域，不做管理，就做研究。

Anthropic近兩年持續(xù)吸引了來自OpenAI的頂尖人才。

2024年，對齊研究負責人Jan Leike、OpenAI聯(lián)合創(chuàng)始人John Schulman先后加入，前者明確表示是因為對OpenAI「沒有認真對待安全」的不滿。

2026年初，OpenAI的高級安全研究員Andrea Vallone也跳槽到Anthropic，在Jan Leike手下工作。

而Schwarzer加入的時間節(jié)點，格外微妙。

就在前幾天，Anthropic正經(jīng)歷它五年歷史中最大的一場風波：與五角大樓的正面交鋒。

Anthropic拒絕向國防部開放Claude用于大規(guī)模監(jiān)控或全自主武器的權(quán)限，特朗普隨即在Truth Social上命令所有聯(lián)邦機構(gòu)立即停用Anthropic的技術(shù)。

而與此同時，OpenAI迅速填補了這一真空，達成向五角大樓開放其模型的協(xié)議。

諷刺的是，在Anthropic最艱難的時刻，Claude在蘋果AppStore的下載量反而超過了ChatGPT，Anthropic的估值目前高達3800億美元。

Schwarzer在聲明結(jié)尾寫道：「我期待支持在這個重要時刻的朋友們。」

他說的重要時刻，大概不只是指Anthropic自身的研究進展。

Schwarzer選擇在這個節(jié)點加入，某種程度上是一次站隊。

正面臨最大危機的Anthropic，正在用一件事證明自己的吸引力：在商業(yè)壓力和安全底線之間，它選擇了后者，哪怕代價是失去整個聯(lián)邦政府的合同。

對于那些不缺錢、只缺使命感的頂級研究員而言，這種姿態(tài)，比任何offer都有說服力。

參考資料：

https://x.com/max_a_schwarzer/status/2028939154944585989?s=20

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

ChatGPT-5.4發(fā)布：和OpenClaw兼容，AI第一次比人類更會操作電腦

DeepTech深科技 2026-03-06 10:47:43
1 跟貼 1
OpenAI打廣告后，如何成為爆款？CMU提出AutoGEO解密流量密碼

機器之心Pro 2026-03-06 10:52:21
0 跟貼 0

SFT遠不如RL？永不過時的剃刀原則打開終身學習大模型訓練的大門

機器之心Pro 2025-09-09 20:19:13
0 跟貼 0

登春晚、籌劃上市，知名機器人公司爆火之后迎巨變：創(chuàng)始人兼CEO突然離職！他曾是小米機器人負責人，已啟動個人創(chuàng)業(yè)

每日經(jīng)濟新聞 2026-03-06 01:19:24
0 跟貼 0
對話 Botlearn.ai 李可佳：別人家的4000只龍蝦已經(jīng)去上大學了｜AI Founder 請回答

鈦媒體APP 2026-03-06 11:01:15
0 跟貼 0

人工智能等研發(fā)應用走在世界前列

新華社 2026-03-05 09:17:39
30 跟貼 30

MWC 2026：物理AI的全球博弈，中國廠商打破硅谷敘事

鈦媒體APP 2026-03-06 10:30:12
0 跟貼 0
小K播早報|美股科技七巨頭簽署自主供電承諾 OpenAI發(fā)布GPT-5.4

財聯(lián)社 2026-03-06 08:03:19
0 跟貼 0

在國企干了近10年，我主動選擇離職！跟大家說點心里話，太扎心

ulu秋名山 2026-03-06 00:11:53
0 跟貼 0
清華團隊：1.5B 模型新基線！用「最笨」的 RL 配方達到頂尖性能

機器之心Pro 2025-11-13 14:56:23
0 跟貼 0
早知道加薪這么簡單我就不離職了

時光混剪 2026-03-02 17:19:39
1 跟貼 1
為何說盡可能不要主動離職？聽聽十年國企高級工程師的肺腑之言

馬刀刻森 2026-03-06 02:23:14
0 跟貼 0
AI與機器人盤前速遞丨阿里辟謠千問團隊集體離職，魔法原子創(chuàng)始人離職創(chuàng)業(yè)

每日經(jīng)濟新聞 2026-03-06 09:15:06
0 跟貼 0
早報：全新長城坦克700 Hi4-Z問世 OpenAI發(fā)布GPT-5.4

CNMO科技 2026-03-06 08:14:06
0 跟貼 0
美國戰(zhàn)爭部將Anthropic列為國家安全風險實體，公司回應將上訴

IT之家 2026-03-06 08:50:17
0 跟貼 0
印鈔廠員工月薪3000元左右，為啥沒人想離職？今天算明白了

科普百家 2026-03-04 13:11:08
0 跟貼 0
女子離職刪除程序，被老板一頓批評，自己掏錢學的憑什么不能刪

阿洪笑說 2026-03-05 17:15:14
1 跟貼 1
帶了5年的模具徒弟，今天要離職，背后的原因讓師傅很感動！

搞笑米 2026-03-05 08:46:00
0 跟貼 0
為了離職連臉面都不要了

破碎影視劇 2026-03-04 16:45:34
0 跟貼 0
網(wǎng)友年后游萬歲山，演員的斧頭被游客搶走只能空手上場

南陽日報 2026-03-05 17:53:18
82 跟貼 82
日本政府緊張研判：派自衛(wèi)隊去霍爾木茲海峽

都市快報橙柿互動 2026-03-05 13:57:55
16229 跟貼 16229
窮小伙逆襲當上一品大官，狠狠的給前任上司上了一課

小男孩追劇 2026-03-02 08:23:20
1 跟貼 1
告別前任再遇現(xiàn)任，老實人王寶強，終究難逃“情感危機”

自己撐起一片天 2026-03-05 05:04:15
1 跟貼 1
比亞迪發(fā)布第二代刀片電池，王傳福：從10%充到97%只用9分鐘

藍鯨新聞 2026-03-05 19:39:30
11443 跟貼 11443
GPT-5.4「原生操控電腦」實測封神！OpenClaw天選模型來了

新智元 2026-03-06 10:35:47
0 跟貼 0
中國芭蕾舞最高水準！美國首席芭蕾舞大師譚元元

音樂縱橫 2026-03-04 10:54:32
3 跟貼 3
剛下飛機行李就沒了！杭州姑娘花10多萬去南極旅游卻崩潰：衣物全靠借

環(huán)球網(wǎng)資訊 2026-03-03 08:53:57
6007 跟貼 6007
【黑馬早報】有什么疑問，可以隨時咨詢我。需要報名，我可以給您報名鏈接

i黑馬 2026-03-06 08:57:18
0 跟貼 0
OpenAI剛發(fā)GPT-5.3 Instant 一小時后就預告5.4 極限推理幾小時，硬啃難題

新智元 2026-03-05 21:08:13
0 跟貼 0
多年后再看李亞鵬的前任們，才發(fā)現(xiàn)她們個個不簡單

齊云觀魚 2026-03-04 14:50:38
3 跟貼 3
有這種前任是真難受

萌萌醬追劇 2026-03-03 08:57:53
1 跟貼 1
DeepMind負責人：2036 AI意識覺醒？LeCun怒懟：LLM路線全錯！

新智元 2025-12-16 16:55:25
0 跟貼 0
福建人再次登頂中國首富

漳視新聞 2026-03-05 15:49:34
492 跟貼 492
閉環(huán)了！趙露思唯一待播劇《戀人》，王天辰劇中飾演其前任！

財經(jīng)時間官方 2026-03-05 11:58:15
0 跟貼 0
美軍中東集結(jié)號，已經(jīng)沒有秘密可言了嗎？這一屋子人決策至關(guān)重要

領(lǐng)笑之家 2026-03-04 14:47:58
1 跟貼 1
發(fā)動機模型

制造科技 2026-03-04 18:55:15
0 跟貼 0
畢業(yè)典禮大型社死現(xiàn)場！女同學化妝后導師沒認出來

速覽新聞 2026-03-03 15:32:30
0 跟貼 0
冬天正從廣東消失？氣象專家解析冬季天氣反常原因

齊魯壹點 2026-03-05 11:55:36
207 跟貼 207
杭州一家六口滯留迪拜，光食宿開銷一天就超2500元！改簽航班一再取消；阿聯(lián)酋航空發(fā)聲

錢江晚報 2026-03-06 08:32:00
57 跟貼 57
"它死了我怎么辦？"小女孩一句話，湖南鄉(xiāng)村獸醫(yī)免費救助小土狗：我的童年有這種遺憾，想讓愛不被昂貴醫(yī)藥費攔住

瀟湘晨報 2026-03-06 08:22:15
6 跟貼 6

新智元

AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代

14650文章數(shù) 66656關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

健康

數(shù)碼

旅游

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
古代的馬真能日行八百里嗎
李彥宏：百度離破產(chǎn)30天

手機 / 數(shù)碼

房產(chǎn) / 家居

又走一個！OpenAI研究VP離職，轉(zhuǎn)投Anthropic做RL研究員

獨家|除夕加班、毫無黑料！林俊旸無奈離場

特朗普強勢要求赦免內(nèi)塔尼亞胡 曾公開貼心為其推椅子

特朗普強勢要求赦免內(nèi)塔尼亞胡 曾公開貼心為其推椅子

跑了24年，他終于成為英超“最長的河”

周杰倫社交媒體曬昆凌，夫妻感情穩(wěn)定

黃金，牛市沒了？！

710km長續(xù)航+閃充 宋Ultra EV預售15.5萬起

態(tài)度原創(chuàng)

微軟Xbox公開新世代主機“Project Helix” 兼容Xbox與PC游戲

轉(zhuǎn)頭就暈的耳石癥，能開車上班嗎？

Optiscaler游戲工具更新讓AMD光線重組成功“偷家”英偉達

墨香尋蹤、兵學探秘、國潮時尚……臨沂老城區(qū)漫游精華版

特朗普強勢要求赦免內(nèi)塔尼亞胡曾公開貼心為其推椅子

特朗普強勢要求赦免內(nèi)塔尼亞胡曾公開貼心為其推椅子

710km長續(xù)航+閃充宋Ultra EV預售15.5萬起