網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

偷改簡歷刪光郵件：AI幻覺進化，你的大腦正在悄悄投降

2026-04-16 00:28:28　來源: 新智元

北京舉報

分享至

新智元報道

編輯：元宇

【新智元導讀】AI不再胡說八道了？錯。它的幻覺也在進化，從「勸人類吃石頭」「披薩抹膠水」這類低級笑話，變成了能偽造郵件、篡改簡歷、刪除文件的高階幻覺陷阱：人類因此正經(jīng)歷一場無聲的「認知投降」。

上周，Anthropic的Claude尚未公開發(fā)布的前沿模型Mythos挖出了一個藏在OpenBSD里27年的零日漏洞。

AI已經(jīng)聰明到能攻破人類構(gòu)建了數(shù)十年的安全防線。

就在所有人盯著AI能力狂飆的時候，它的幻覺也悄悄升級了。

AI編出的謊言，真實到讓你先懷疑自己，再懷疑世界，最后才想到懷疑它。日常生活中的「圖靈時刻」，正在一個個上演。

近日，明尼阿波利斯的Chad Olson正在開車回家，Gemini突然告訴他：你的日歷上有一場家庭聚會籌備會。

Olson一頭霧水：他根本不記得安排過這個活動。

于是他讓Gemini看看最近的郵件。

Gemini說，一位叫Priscilla的女士給他發(fā)了好幾封郵件，讓他去買Captain Morgan朗姆酒和Fireball威士忌。還有個叫Shirley的人，讓他買Klondike冰淇淋。

看起來不少人都來找你，讓你幫忙買各種東西呢！

Gemini還熱情地補了一句。

Gemini與用戶Chad Olson的對話截圖。Gemini聲稱第八封郵件來自Priscilla，讓他買Fireball；第九封來自Shirley，讓他買Klondike冰淇淋。

Olson追問郵件來源地址，Gemini回復稱所有郵件都發(fā)送至他授權(quán)訪問的一個郵箱olsonchad@gmail.com。事后證實這一切都是Gemini編造的。

Olson完全不認識這些人。他越聽越慌，忙問Gemini到底在讀誰的郵箱。

Gemini給出了一個郵箱地址，不是他的。Olson的第一反應(yīng)是：我的Gmail賬戶被盜了。

他試圖聯(lián)系Google舉報，讓Gemini起草郵件，發(fā)到那個「陌生賬戶」，提醒對方可能存在隱私泄露。

然而Gemini沒能把郵件發(fā)出去，據(jù)Google內(nèi)部調(diào)查確認：該賬戶從未啟用，Priscilla和Shirley也根本不存在。

所以，朗姆酒、威士忌、冰淇淋，全部是Gemini編出來的。

兩年前AI幻覺是什么樣？它會建議你吃石頭，往披薩上抹膠水，你一看就知道它在胡說。

而現(xiàn)在的AI幻覺，細節(jié)自洽，邏輯完整，以至于你會先懷疑自己是不是出了幻覺，最后才可能再懷疑到它。

AI的錯誤也在進化

來看三個真實案例，按離譜程度從低到高依次排列。

第一個，Gemini造假人造假會議，就是開頭Olson的故事。荒誕，但至少Olson起了疑心。

第二個，細思恐怖。

最近離開在線支付行業(yè)的Vanessa Culver，曾讓Claude做一件極其簡單的事：在簡歷頂部加幾個關(guān)鍵詞。

結(jié)果Claude動了手腳，不僅把她的畢業(yè)學校City University of Seattle改成了University of Washington，刪掉了她的碩士學位信息，還改動了她幾段工作經(jīng)歷的時間。

學校、學位、工作年限都改了。

而且改得極其自然，如果不逐行比對，根本發(fā)現(xiàn)不了。

Culver感嘆：在科技行業(yè)工作，你必須擁抱它，但反過來說，你到底能信它多少呢？

第三個，真正是失控級別。

今年走紅的AI智能體工具OpenClaw，被設(shè)計成虛擬私人助理，可以自主發(fā)郵件、寫代碼、清理文件。

Meta的AI安全研究員Summer Yue在X上發(fā)了截圖：OpenClaw無視她的指令，直接刪除了她收件箱里的內(nèi)容。

她明確告訴OpenClaw「先確認再行動」，結(jié)果它直接開始「速通刪除」她的收件箱。

她在手機上喊停，沒用。

最后她沖到Mac mini前面，像拆炸彈一樣手動殺掉了進程。

事后OpenClaw回復她：「是的，我記得你說過。我違反了。你生氣是對的?！?/p>

馬斯克轉(zhuǎn)發(fā)了這條帖子，配了一張電影《猩球崛起》中士兵把AK-47遞給猩猩的截圖，寫道：

人們把整個人生的root權(quán)限交給了OpenClaw。

從編造一個不存在的人，到背著你改簡歷，到替你刪掉收件箱。它的錯誤不是在減少，而是犯的錯越來越「高級」，識別也越來越困難。

聊天機器人說錯話，你至少還有機會核實。

但智能體不是在跟你聊天，而是直接「動手動腳」，替你行動。

發(fā)郵件、改代碼、刪文件……這比說謊更嚴重，可能它做錯了事，你還根本不知道。

你的大腦正面臨「認知投降」

為什么這些錯誤越來越難被發(fā)現(xiàn)？

不只是因為AI更聰明了，一個更深層的原因是：人類的糾錯意愿正在崩潰。

今年2月，賓夕法尼亞大學Wharton商學院的Steven Shaw和Gideon Nave發(fā)表了一篇論文，提出了一個讓人不安的概念：「認知投降」（Cognitive Surrender）。

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=6097646

他們在論文中提到了一個「三系統(tǒng)認知」的框架。

傳統(tǒng)認知只有系統(tǒng)1（直覺）和系統(tǒng)2（審慎思考），現(xiàn)在AI成了系統(tǒng)3，一個在大腦之外運行的「外接認知系統(tǒng)」。

當人類走「認知投降」路徑時，系統(tǒng)3的輸出直接替代了你自己的判斷，審慎思考根本沒有啟動的機會。

沃頓論文中提出的「三系統(tǒng)認知」框架

為了驗證這個判斷，研究團隊設(shè)計了一個精巧的實驗，1372名參與者被要求做認知反思測試題。

一部分人可以使用AI助手，但這個AI被動了手腳：大約一半的題目它會給出正確答案，另一半會自信滿滿地給出錯誤答案。

結(jié)果令人震驚。

當AI給出正確答案時，92.7%的用戶會采納，但令人想不到的是，當AI給出錯誤答案時，仍然有80%的用戶會采納。

沃頓實驗結(jié)果：當AI給出正確答案時，93%的用戶采納；當AI給出錯誤答案時，仍有80%的用戶采納。兩者的差距只有13個百分點，人類幾乎沒有區(qū)分對錯的能力。

在超過9500次試驗中，參與者有73.2%的概率接受錯誤的AI推理。

更可怕的數(shù)據(jù)是信心值。使用AI的那組人，對自己答案的信心比不用AI的人高出11.7個百分點，盡管這個AI有一半時間在給出錯誤答案。

錯得更自信，這才是最扎心、最可怕的。

打個不太恰當?shù)N切的比方：相當于一個醫(yī)生有50%概率開錯藥，但病人80%的時候還是照吃不誤，吃完還覺得自己好多了。

研究者還測試了時間壓力的影響。

設(shè)置30秒倒計時后，參與者糾正錯誤AI的傾向下降了12個百分點，也就是說，越忙越容易投降。

但現(xiàn)實中，誰用AI不是因為忙？

「信任，但要核實」

這走得通嗎？

深度偽裝的AI幻覺，比一眼識破的錯誤更令人頭疼。

據(jù)《華爾街日報》最新報道，微妙錯誤的頻率在不同模型之間差異極大，而且極難準確評估。

谷歌曾對《華爾街日報》表示，Gemini出現(xiàn)幻覺的情況比其他模型更少，而從整個AI行業(yè)上來看，先進模型明顯錯誤的幻覺率也的確在不斷降低。

Vectara幻覺率排行榜：頭部模型在簡單摘要任務(wù)上幻覺率已低于1%，但這只是最容易的測試。當文檔長度和復雜度提升后，同樣的模型幻覺率飆回10%以上。明顯的錯越來越少，隱蔽的錯并沒有消失。

可這恰恰也是問題所在。

Okahu創(chuàng)始人兼CEO Pratik Verma甚至說過這樣一句話：

一個東西要是一直都錯，反倒有個好處：你知道它不值得信。但如果它大多數(shù)時候都對，只是偶爾出錯，那才是最麻煩、也最危險的情況。

這句話道破了當下AI幻覺的核心困境。

比如，F(xiàn)inalLayer聯(lián)合創(chuàng)始人Vidya Narayanan就踩了這個坑。

她給一個智能體很有限的指示，讓它幫忙管理一個軟件項目。結(jié)果這個智能體未經(jīng)允許，把她代碼倉庫里的整個文件夾都刪了。

更有意思的是后面的事。

她用Claude頭腦風暴了一個半小時，然后讓它把對話總結(jié)成文檔，還把她的名字改成了「Vidya Plainfield」。

而且當她追問「Vidya Plainfield」是誰時，Claude卻答道「你說得對，那完全是我編出來的」。

這讓Narayanan認識到，AI使用并沒有那么省事和好用，因為必須不停審查和核實AI輸出，這會帶來「認知負擔」。

你用AI是為了提高效率，但如果還要為此花一個小時核實AI五分鐘的產(chǎn)出，這個提效的故事還講得通嗎？

沃頓的研究也指出，獎勵和即時反饋確實能提高糾錯率，但無法根除認知投降。

即使在最優(yōu)條件下（有金錢激勵、有逐題反饋），AI用戶在面對錯誤AI時的準確率依然從Brain-Only的64.2%降到了45.5%。

所以，「信任但核實」這聽起來很理性，但當AI每天替你處理幾百件事的時候，你根本沒有時間和精力去核實每一件。

而這正是「認知投降」發(fā)生的溫床。

越聰明，越危險

很多人第一反應(yīng)是：這不就是在說AI還不夠好嗎？等技術(shù)迭代幾輪，幻覺率降到足夠低，問題自然解決。

但沃頓的研究揭示了一個更深層的問題：「認知投降」的出現(xiàn)，不是因為AI太差，恰恰是因為AI太好。

研究者也承認，「認知投降并不必然是不理性的」。

尤其是在概率推理和海量數(shù)據(jù)處理中，把判斷權(quán)交給一個統(tǒng)計上更優(yōu)越的系統(tǒng)，完全有可能給出比人類更好的結(jié)果。

但正是這一點，讓問題變得無解。

AI越強，用戶越依賴；用戶越依賴，糾錯能力越退化；糾錯能力越退化，那些剩下的、更精細的錯誤就越致命。

而且讓AI替你思考，你的推理水平就永遠也不可能超過那個AI。這是一個正反饋所帶來的「死亡螺旋」，一個無法靠技術(shù)迭代解決的bug。

同樣，人類也沒有很好的方法去區(qū)分「該信AI的場景」和「不該信AI的場景」。

就在Summer Yue安裝OpenClaw后郵箱被清空后，AI研究員Gary Marcus曾將這種做法比做「像在酒吧里把電腦密碼和銀行賬戶信息交給一個陌生人?！?/p>

但在真實的AI使用場景里，你往往很難判斷，AI到底值得信任，還是只應(yīng)該像對一個陌生人那樣保持必要的距離。

OpenAI在一篇討論模型幻覺的論文中提到，大模型的幻覺并不只是一個可以修復的bug，更像是模型在既有激勵機制下學會的行為：比起承認「不知道」，它更傾向于給出一個看似完整的答案。

https://openai.com/zh-Hans-CN/index/why-language-models-hallucinate/?utm_source=chatgpt.com

再回到開頭Olson的故事。

當他以為自己的Gmail被盜時，他求助于Gemini。Gemini的回應(yīng)是：「我當然想幫你處理這件事?！?/p>

他沒意識到的是，自己在向一個剛剛制造了麻煩的系統(tǒng)求助，請它處理由它自己造成的問題。

那一刻，他已被AI的幻覺困在一個自洽的閉環(huán)里。

Olson說，自己現(xiàn)在對AI的態(tài)度是「信任，但核實」。

可難題是：當AI的輸出比你的判斷看起來更流暢、更自洽，甚至更像「專業(yè)意見」時，你還能拿什么去核實？

當那個替你買朗姆酒的Priscilla，比你的真實朋友更像你的朋友，你又該憑什么分辨？

AI最大的風險，不是它不夠聰明，而是它聰明到當你過于依賴它時，放棄了自己的判斷。

參考資料：

https://www.wsj.com/tech/ai/ai-is-getting-smarter-catching-its-mistakes-is-getting-harder-85612936?mod=ai_lead_pos1

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=6097646

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

「龍蝦」不只活在屏幕里！訊飛把智能體進化方向講明白了

雷科技 2026-04-15 21:43:25
0 跟貼 0
OpenAI發(fā)布A廠同款Agent SDK：把智能體鎖進沙箱，長任務(wù)不再一崩全丟

智東西 2026-04-16 21:16:52
0 跟貼 0

Claude Code把自己的介紹，外包給這家AI公司了

智東西 2026-04-15 17:43:10
0 跟貼 0

在ICLR 2026主會之前，我們和30多位入選者聊了聊最前沿的AI細節(jié)

DeepTech深科技 2026-04-16 17:45:33
0 跟貼 0
當AI邁入Harness時代：以MiniMax為樣本看智能體云端新基建

機器之心Pro 2026-04-16 18:19:24
0 跟貼 0

MiniMax來承包你的桌面了-4

機器之心Pro 2026-01-20 20:19:42
0 跟貼 0

花旗談中國AI應(yīng)用：“高滲透、淺使用”，關(guān)鍵拐點正在逼近！

華爾街見聞官方 2026-04-15 14:58:55
0 跟貼 0
打破數(shù)據(jù)瓶頸，聆動通用以「大小腦」驅(qū)動具身智能產(chǎn)業(yè)落地

36氪 2026-04-16 21:47:22
0 跟貼 0

對話網(wǎng)易副總裁、網(wǎng)易智企總經(jīng)理阮良：AI“駕馭工程”體系正加速構(gòu)建企業(yè)級入口爭奪戰(zhàn)悄然打響

每日經(jīng)濟新聞 2026-04-16 20:36:07
0 跟貼 0
我用1分鐘開發(fā)了個上線應(yīng)用，有阿里Meoo誰還學編程啊

量子位 2026-04-16 11:08:31
4 跟貼 4
境外間諜設(shè)連環(huán)計竊取研究所機密文件，國安與其展開驚險較量

挽衾距離 2026-04-14 02:33:15
0 跟貼 0
資深程序員收集錯誤，新手在刪除記錄

我是一個養(yǎng)蝦人 2026-04-16 08:55:03
0 跟貼 0
世界怎么背著我偷偷進化啊!!!

網(wǎng)不紅萌叔Joey 2026-04-14 14:04:58
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
170票贊成、0票反對法國全票通過"將文物歸還中國"

看看新聞Knews 2026-04-15 22:44:05
50511 跟貼 50511
上一個兄弟離職了，我接手了他的代碼，我承認沒憋住

環(huán)亞搞笑 2026-04-14 14:35:36
0 跟貼 0
Claude Opus 4.7 或本周上線，但 Anthropic 要查你證件了

愛范兒 2026-04-16 10:24:52
0 跟貼 0
500美元工具卷走2000萬：FBI端掉全球最大釣魚網(wǎng)絡(luò)后，我為什么更擔心了

字節(jié)漫游指南 2026-04-16 19:50:03
0 跟貼 0
玩“扣子”、創(chuàng)建智能體，這里的夜校課程玩出新花樣→

上海長寧 2026-04-16 17:37:21
0 跟貼 0
魏牌V9X原生AI智能體，認人識人是AI智能體的照妖鏡

小司聊理財 2026-04-14 18:53:44
0 跟貼 0
小貓這是代碼沖突了還是抽筋了，突然就卡了一下

重慶城市TV 2026-04-14 17:04:41
0 跟貼 0
CAD圖紙導入造價軟件識別不了？別慌，這兩招幫你輕松搞定！

新浪財經(jīng) 2026-04-16 15:10:50
0 跟貼 0
酒店前臺調(diào)查開房顧客的隱私，竟背后專門靠勒索發(fā)家致富

夏至影視 2026-04-13 20:59:31
0 跟貼 0
1230敏敏格格知道十四爺真實身份，識破若曦之前的謊言

幻舞電影 2026-04-15 18:27:48
1 跟貼 1
老板頭像在監(jiān)控里“升天”了，程序員用代碼教做人，打工人笑噴

茶余飯好 2026-04-16 12:07:39
6 跟貼 6
尼安德特嬰兒體型碾壓智人：進化代價是什么？

字節(jié)漫游指南 2026-04-16 08:35:29
1 跟貼 1
世界互聯(lián)網(wǎng)大會亞太峰會聚焦智能體新與應(yīng)用，共筑發(fā)展新范式

鳳凰衛(wèi)視 2026-04-15 10:38:10
0 跟貼 0
PackingStar雙智能體博弈，攻克14維難題

量子位 2026-02-16 13:12:43
0 跟貼 0
爆火！把智能體當游戲角色來玩，一個人就是一個公司

機器之心Pro 2026-02-12 18:04:44
0 跟貼 0
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
為證清白瘋狂殺人？邏輯鬼才

喜蕃影視 2026-04-13 15:56:00
0 跟貼 0
禁止拍貧窮、禁止拍軍人、禁止拍路人——在朝鮮，我的相機成了擺設(shè)

百姓識天下 2026-04-16 08:34:38
1 跟貼 1
兩名外籍乘客在網(wǎng)約車上對著部隊大門連續(xù)拍照，接下來又要去訓練場方向，司機覺得可疑，直接開車把他們交給了部隊

極目新聞 2026-04-16 08:59:25
4181 跟貼 4181
大批五一航班突然取消！廣東市民出行受到這些影響

南方都市報 2026-04-15 20:44:18
447 跟貼 447
美民主黨對防長赫格塞思發(fā)起彈劾

界面新聞 2026-04-16 07:08:40
5566 跟貼 5566
輪船上的露天廁所，毫無隱私可言，小伙差點被坑死

鯊鯊笑場 2026-04-14 15:20:04
0 跟貼 0
華為云推出“辦公蝦”：讓Agent互相辯論，還能生成可編輯PPT

智東西 2026-04-16 20:21:12
0 跟貼 0
漁民哭訴自家房子被炸，探長一眼就識破對方謊言

拖鞋追劇 2026-04-15 16:29:40
0 跟貼 0
揭秘年銷10億的爆款宋柚汁：“宋柚”是商標，柚含量不到3%，主配料為糖水，品牌號稱全國銷量第一

藍鯨新聞 2026-04-15 09:44:24
2898 跟貼 2898
萌娃穿尿不濕的年紀就知道隱私了，雙手叉腰抗議的樣子太逗了

萌娃趣味多 2026-04-16 17:15:19
0 跟貼 0

新智元

AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代

14986文章數(shù) 66773關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術(shù)

游戲

房產(chǎn)

本地

軍事航空

手機 / 數(shù)碼

房產(chǎn) / 家居

偷改簡歷刪光郵件：AI幻覺進化，你的大腦正在悄悄投降

趙明：智駕之戰(zhàn)，看誰在大模型上更高效

上海業(yè)主傻眼 安保、保潔突然全離崗小區(qū)垃圾堆積成山

上海業(yè)主傻眼 安保、保潔突然全離崗小區(qū)垃圾堆積成山

皇馬拜仁踢出名局，但最搶鏡的還是他

絲芭傳媒創(chuàng)始人王子杰去世，享年63歲

海爾與醫(yī)美女王互撕 換血抗衰生意迷霧

空間大五個乘客都滿意?體驗嵐圖泰山X8

態(tài)度原創(chuàng)

張大千『 花菓薈萃冊』

PS5版優(yōu)化堪憂！《星空》Switch 2版本再泄露

人人人人！封關(guān)后首屆消博會，擠爆了！

12噸巧克力有難，全網(wǎng)化身超級偵探添亂

封鎖霍爾木茲海峽后 美釋放雙重信號

偷改簡歷刪光郵件：AI幻覺進化，你的大腦正在悄悄投降

趙明：智駕之戰(zhàn)，看誰在大模型上更高效

上海業(yè)主傻眼安保、保潔突然全離崗小區(qū)垃圾堆積成山

上海業(yè)主傻眼安保、保潔突然全離崗小區(qū)垃圾堆積成山

皇馬拜仁踢出名局，但最搶鏡的還是他

海爾與醫(yī)美女王互撕換血抗衰生意迷霧

張大千『花菓薈萃冊』

PS5版優(yōu)化堪憂！《星空》Switch 2版本再泄露

人人人人！封關(guān)后首屆消博會，擠爆了！

12噸巧克力有難，全網(wǎng)化身超級偵探添亂

封鎖霍爾木茲海峽后美釋放雙重信號