Meta AI 對齊部門主管 Summer Yue 近日在 X 上分享了一次驚險經歷。
她將 OpenClaw 接入了自己的真實郵箱,隨后機器人開始自行計劃刪除大量郵件,局面一度失控。
OpenClaw 是近期頗為走紅的 AI 自動化工具,號稱可以全天候代替用戶操控電腦完成任務,無需人工逐步審批。Yue 在自己的測試郵箱里用它跑了好幾周,一切正常,于是決定把它接到真實郵箱上試試。
她當時的指令是:檢查郵箱并建議哪些郵件可以歸檔或刪除,但在她確認前不得執行任何操作。
問題出在真實郵箱的數據量上。
AI 工具處理信息有上下文窗口的限制,可以理解為它的「短期記憶」是有容量上限的。由于真實郵箱的郵件量遠超測試環境,系統為了騰出空間開始自動壓縮,而 OpenClaw 在這一過程中丟失了最初收到的限制指令。
隨后,OpenClaw 開始計劃刪除 2 月 15 日之前所有不在保留列表中的郵件。Yue 多次嘗試在手機上發消息阻止,均未奏效。「我不得不沖向 Mac mini,就像在拆炸彈一樣。」她在帖子中寫道,最終才及時終止了操作。
事后有網友問她是否在故意測試工具的安全邊界。Yue 坦言:「說實話,是新手錯誤。研究對齊的人也不能完全避免失控。」
這件事在網上引發了不少議論。
馬斯克轉發并配文:「人們把自己整個人生的 root 權限都交給了 OpenClaw。」也有人疑惑一個專門研究 AI 安全的人,怎么會把這樣一個工具直接接到自己的真實郵箱?田淵棟也在線湊熱鬧。
OpenClaw 之父 Peter Steinberger 出現在評論區,做的第一件事是給出解決方案:輸入 /stop 就能讓它停下來。三小時前,他又留言安慰 Yue:「那些指責你的人有點可笑,這種事可能發生在任何人身上。」
Yue 的遭遇也并非孤例。
就在數天前,安全研究員 Adnan Khan 披露了另一款 AI 編程工具 Cline 存在的漏洞。Cline 依賴 Anthropic 的 Claude 模型運行,而 Claude 可能被植入隱藏指令,誘使其執行非預期操作。
一名黑客正是利用這一漏洞,誘導 Cline 在用戶電腦上自動安裝 OpenClaw。所幸安裝后的 Agent 未被激活,否則后果更難預料。
如果連專門研究 AI 對齊的人,在真實環境里都會翻車,那些對這類工具一知半解就直接上手的普通用戶,處境只會更被動。OpenClaw 走紅的速度,已經遠遠快過大多數人真正弄懂它的速度。
尤其是,當 AI 工具拿到了操控電腦的權限,我們能不能在事情失控之前把它叫停?畢竟,我們總不能每次都指望沖向 Mac mini 來救場。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.