![]()
整理 | 屠敏
出品 | CSDN(ID:CSDNnews)
近日,AI 安全領域迎來了一則頗具意味的人事變動。
Anthropic,這家以“安全 AI”為核心定位的明星公司,其高級人工智能安全負責人 Mrinank Sharma 在 X 上宣布自己已于 2 月 9 日正式離職。
![]()
這一決定并非簡單的職業轉向。
在公開信中,他直言離開的原因與更深層的憂慮有關:對 AI 發展方向的反思、對全球風險的警覺,以及對“價值觀是否真正主導行動”的持續拷問。他提到,公司內部所承受的多重壓力,正在與那些被反復強調的核心理念發生沖突。
![]()
![]()
一位 AI 高級安全負責人寫的辭職信
在致同事的公開信中,Mrinank 首先回顧了自己在 Anthropic 的兩年歷程。他坦言:“我已經完成了自己當初來到這里想做的事情。”
兩年前,他剛結束博士學業,來到舊金山,希望把精力投入到 AI 安全這個當時仍相對前沿、但已暗流涌動的方向。
這兩年,他的工作并不抽象:
他深入研究了AI 的“諂媚”(sycophancy)現象,即為什么模型會傾向于迎合用戶的偏好,甚至在明知錯誤的情況下給出“討好式”回答。
此外,他主導開發了針對AI 輔助生物恐怖主義風險的防御機制,并將其真正落地到產品與生產環境中。
他還參與建立了內部透明度機制,推動“價值觀”從口號走向制度,嘗試讓組織在面對現實壓力時,仍然能夠有據可依。
而他最后的一項研究,觸及了一個更根本的問題:
AI 助手是否可能讓我們變得“不那么人類”?
它會不會在不知不覺中扭曲我們的判斷、依賴方式,甚至價值感?
然而,這些成就并未讓他選擇留下。
他在信中明確表示:
“我清楚地意識到,是時候繼續向前了。”
![]()
“多重危機”之下的沖突
談及離開的原因,Mrinank 并沒有指向某一項具體分歧,而是將視角拉得更遠。
他寫道,「自己不斷反思我們所處的處境。世界正面臨危險,這不僅僅是 AI 或生物武器的問題,而是一系列彼此交織的危機同時展開。有人稱之為“多重危機”(poly-crisis),而其背后或許還存在更深層的“元危機”(meta-crisis)。」
在他看來,人類影響世界的能力正以前所未有的速度擴張。問題在于,我們的智慧與成熟度,是否跟得上這種力量的增長。
如果能力持續上升,而判斷力、倫理自覺與集體理性卻停滯甚至退化,后果難以估量。
在公司工作的這些年,他反復體會到一件事:讓價值觀真正主導行動,并不容易。
這種張力存在于個人內心,也存在于組織層面。現實壓力、競爭節奏、資本期待、輿論環境……都會在某些時刻,把真正重要的事情擠到邊緣。
他沒有用激烈的語言批評誰,而是承認這種拉扯本身就是時代的一部分。這種現象不僅存在于一家 AI 公司,也存在于更廣闊的社會結構中。
最終,他選擇回應自己內在的聲音:
“在不斷面對并傾聽這種內在與外在的現實之后,我逐漸看清自己必須做什么。我希望以一種完全符合自己內心與原則的方式去貢獻力量。”
他引用了詩人 David Whyte 的一句話——那些“無權被忽視的問題”;也提到里爾克的提醒——有些問題不是被回答,而是被“活出來”。
對他而言,這意味著離開。
![]()
從代碼到詩行:一場關于“認知方式”的轉向
更令人意外的是,他并未公布自己的下一步具體去向,也沒有投身另一家 AI 公司。
他選擇擁抱不確定性。
信中有一句禪宗名言:“不知,最為親近。”
這似乎是他此刻的狀態,他想要主動騰出空間,暫時放下這些年來支撐自己的結構與身份標簽,看看在它們退去之后,會浮現什么。
他的下一步計劃帶著濃厚的人文色彩。
他表示,希望攻讀詩歌學位,認真學習詩歌寫作。其認為,在技術不斷改造世界的時代,“詩意的真相”與“科學的真相”同樣重要。前者幫助我們理解意義、關系與感受,后者幫助我們構建工具與系統。如果兩者失衡,技術就可能失去方向。
與此同時,他打算將更多精力投入到引導、教練、社區建設與團隊實踐中。從一名技術安全的守護者,轉向促進人與人之間更深層連接的實踐者。
這并不是對技術的否定,而是對認知方式的拓展。
在信的結尾,他附上了 William Stafford 的詩《The Way It Is》。詩中有一句話:
“有一條你追隨的線,在變化的事物中穿行,但它本身不變。”
或許,這條“線”正是他真正想守護的東西。
![]()
當安全專家選擇離開
Anthropic 一直被視為強調安全與對齊的代表性公司。如今,一位高級安全負責人主動離開,難免引發外界猜測。
與此同時,Mrinank 也并不是近期離職的唯一一人。
正如《Business Insider》報道的那樣,包括 Harsh Mehta 和 Behnam Neyshabur 在內的多位研究人員,最近也離開了 Anthropic,去“開啟新的事業”。
但如果僅把 Mrinank 這件事解讀為“內部矛盾”或“路線分歧”,可能過于簡單。
這封信更像是 Mrinank 想要站在外部的視角,探清 AI 的發展。
未來沒有前后端,只有 AI Agent 工程師。
這場十倍速的變革已至,你的下一步在哪?
4 月 17-18 日,由 CSDN 與奇點智能研究院聯合主辦「2026 奇點智能技術大會」將在上海隆重召開,大會聚焦 Agent 系統、世界模型、AI 原生研發等 12 大前沿專題,為你繪制通往未來的認知地圖。
成為時代的見證者,更要成為時代的先行者。
奇點智能技術大會上海站,我們不見不散!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.