337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

偷改簡歷刪光郵件:AI幻覺進化,你的大腦正在悄悄投降

0
分享至


新智元報道

編輯:元宇

【新智元導讀】AI不再胡說八道了?錯。它的幻覺也在進化,從「勸人類吃石頭」「披薩抹膠水」這類低級笑話,變成了能偽造郵件、篡改簡歷、刪除文件的高階幻覺陷阱:人類因此正經(jīng)歷一場無聲的「認知投降」。

上周,Anthropic的Claude尚未公開發(fā)布的前沿模型Mythos挖出了一個藏在OpenBSD里27年的零日漏洞。

AI已經(jīng)聰明到能攻破人類構(gòu)建了數(shù)十年的安全防線。

就在所有人盯著AI能力狂飆的時候,它的幻覺也悄悄升級了。

AI編出的謊言,真實到讓你先懷疑自己,再懷疑世界,最后才想到懷疑它。日常生活中的「圖靈時刻」,正在一個個上演。

近日,明尼阿波利斯的Chad Olson正在開車回家,Gemini突然告訴他:你的日歷上有一場家庭聚會籌備會。

Olson一頭霧水:他根本不記得安排過這個活動。

于是他讓Gemini看看最近的郵件。

Gemini說,一位叫Priscilla的女士給他發(fā)了好幾封郵件,讓他去買Captain Morgan朗姆酒和Fireball威士忌。還有個叫Shirley的人,讓他買Klondike冰淇淋。

看起來不少人都來找你,讓你幫忙買各種東西呢!

Gemini還熱情地補了一句。


Gemini與用戶Chad Olson的對話截圖。Gemini聲稱第八封郵件來自Priscilla,讓他買Fireball;第九封來自Shirley,讓他買Klondike冰淇淋。


Olson追問郵件來源地址,Gemini回復稱所有郵件都發(fā)送至他授權(quán)訪問的一個郵箱olsonchad@gmail.com。事后證實這一切都是Gemini編造的。

Olson完全不認識這些人。他越聽越慌,忙問Gemini到底在讀誰的郵箱。

Gemini給出了一個郵箱地址,不是他的。Olson的第一反應(yīng)是:我的Gmail賬戶被盜了。

他試圖聯(lián)系Google舉報,讓Gemini起草郵件,發(fā)到那個「陌生賬戶」,提醒對方可能存在隱私泄露。

然而Gemini沒能把郵件發(fā)出去,據(jù)Google內(nèi)部調(diào)查確認:該賬戶從未啟用,Priscilla和Shirley也根本不存在。

所以,朗姆酒、威士忌、冰淇淋,全部是Gemini編出來的。

兩年前AI幻覺是什么樣?它會建議你吃石頭,往披薩上抹膠水,你一看就知道它在胡說。

而現(xiàn)在的AI幻覺,細節(jié)自洽,邏輯完整,以至于你會先懷疑自己是不是出了幻覺,最后才可能再懷疑到它。

AI的錯誤也在進化

來看三個真實案例,按離譜程度從低到高依次排列。

第一個,Gemini造假人造假會議,就是開頭Olson的故事。荒誕,但至少Olson起了疑心。

第二個,細思恐怖。

最近離開在線支付行業(yè)的Vanessa Culver,曾讓Claude做一件極其簡單的事:在簡歷頂部加幾個關(guān)鍵詞。

結(jié)果Claude動了手腳,不僅把她的畢業(yè)學校City University of Seattle改成了University of Washington,刪掉了她的碩士學位信息,還改動了她幾段工作經(jīng)歷的時間。

學校、學位、工作年限都改了。

而且改得極其自然,如果不逐行比對,根本發(fā)現(xiàn)不了。

Culver感嘆:在科技行業(yè)工作,你必須擁抱它,但反過來說,你到底能信它多少呢?

第三個,真正是失控級別。

今年走紅的AI智能體工具OpenClaw,被設(shè)計成虛擬私人助理,可以自主發(fā)郵件、寫代碼、清理文件。

Meta的AI安全研究員Summer Yue在X上發(fā)了截圖:OpenClaw無視她的指令,直接刪除了她收件箱里的內(nèi)容。


她明確告訴OpenClaw「先確認再行動」,結(jié)果它直接開始「速通刪除」她的收件箱。

她在手機上喊停,沒用。

最后她沖到Mac mini前面,像拆炸彈一樣手動殺掉了進程。

事后OpenClaw回復她:「是的,我記得你說過。我違反了。你生氣是對的?!?/p>


馬斯克轉(zhuǎn)發(fā)了這條帖子,配了一張電影《猩球崛起》中士兵把AK-47遞給猩猩的截圖,寫道:

人們把整個人生的root權(quán)限交給了OpenClaw。

從編造一個不存在的人,到背著你改簡歷,到替你刪掉收件箱。它的錯誤不是在減少,而是犯的錯越來越「高級」,識別也越來越困難。

聊天機器人說錯話,你至少還有機會核實。

但智能體不是在跟你聊天,而是直接「動手動腳」,替你行動。

發(fā)郵件、改代碼、刪文件……這比說謊更嚴重,可能它做錯了事,你還根本不知道。

你的大腦正面臨「認知投降」

為什么這些錯誤越來越難被發(fā)現(xiàn)?

不只是因為AI更聰明了,一個更深層的原因是:人類的糾錯意愿正在崩潰。

今年2月,賓夕法尼亞大學Wharton商學院的Steven Shaw和Gideon Nave發(fā)表了一篇論文,提出了一個讓人不安的概念:「認知投降」(Cognitive Surrender)。


https://papers.ssrn.com/sol3/papers.cfm?abstract_id=6097646

他們在論文中提到了一個「三系統(tǒng)認知」的框架。

傳統(tǒng)認知只有系統(tǒng)1(直覺)和系統(tǒng)2(審慎思考),現(xiàn)在AI成了系統(tǒng)3,一個在大腦之外運行的「外接認知系統(tǒng)」。

當人類走「認知投降」路徑時,系統(tǒng)3的輸出直接替代了你自己的判斷,審慎思考根本沒有啟動的機會。


沃頓論文中提出的「三系統(tǒng)認知」框架

為了驗證這個判斷,研究團隊設(shè)計了一個精巧的實驗,1372名參與者被要求做認知反思測試題。

一部分人可以使用AI助手,但這個AI被動了手腳:大約一半的題目它會給出正確答案,另一半會自信滿滿地給出錯誤答案。

結(jié)果令人震驚。

當AI給出正確答案時,92.7%的用戶會采納,但令人想不到的是,當AI給出錯誤答案時,仍然有80%的用戶會采納。


沃頓實驗結(jié)果:當AI給出正確答案時,93%的用戶采納;當AI給出錯誤答案時,仍有80%的用戶采納。兩者的差距只有13個百分點,人類幾乎沒有區(qū)分對錯的能力。

在超過9500次試驗中,參與者有73.2%的概率接受錯誤的AI推理。

更可怕的數(shù)據(jù)是信心值。使用AI的那組人,對自己答案的信心比不用AI的人高出11.7個百分點,盡管這個AI有一半時間在給出錯誤答案。

錯得更自信,這才是最扎心、最可怕的

打個不太恰當?shù)N切的比方:相當于一個醫(yī)生有50%概率開錯藥,但病人80%的時候還是照吃不誤,吃完還覺得自己好多了。

研究者還測試了時間壓力的影響。

設(shè)置30秒倒計時后,參與者糾正錯誤AI的傾向下降了12個百分點,也就是說,越忙越容易投降。

但現(xiàn)實中,誰用AI不是因為忙?

「信任,但要核實」

這走得通嗎?

深度偽裝的AI幻覺,比一眼識破的錯誤更令人頭疼。

據(jù)《華爾街日報》最新報道,微妙錯誤的頻率在不同模型之間差異極大,而且極難準確評估。


谷歌曾對《華爾街日報》表示,Gemini出現(xiàn)幻覺的情況比其他模型更少,而從整個AI行業(yè)上來看,先進模型明顯錯誤的幻覺率也的確在不斷降低。


Vectara幻覺率排行榜:頭部模型在簡單摘要任務(wù)上幻覺率已低于1%,但這只是最容易的測試。當文檔長度和復雜度提升后,同樣的模型幻覺率飆回10%以上。明顯的錯越來越少,隱蔽的錯并沒有消失。

可這恰恰也是問題所在。

Okahu創(chuàng)始人兼CEO Pratik Verma甚至說過這樣一句話:

一個東西要是一直都錯,反倒有個好處:你知道它不值得信。但如果它大多數(shù)時候都對,只是偶爾出錯,那才是最麻煩、也最危險的情況。

這句話道破了當下AI幻覺的核心困境。

比如,F(xiàn)inalLayer聯(lián)合創(chuàng)始人Vidya Narayanan就踩了這個坑。

她給一個智能體很有限的指示,讓它幫忙管理一個軟件項目。結(jié)果這個智能體未經(jīng)允許,把她代碼倉庫里的整個文件夾都刪了。

更有意思的是后面的事。

她用Claude頭腦風暴了一個半小時,然后讓它把對話總結(jié)成文檔,還把她的名字改成了「Vidya Plainfield」。

而且當她追問「Vidya Plainfield」是誰時,Claude卻答道「你說得對,那完全是我編出來的」。

這讓Narayanan認識到,AI使用并沒有那么省事和好用,因為必須不停審查和核實AI輸出,這會帶來「認知負擔」。

你用AI是為了提高效率,但如果還要為此花一個小時核實AI五分鐘的產(chǎn)出,這個提效的故事還講得通嗎?

沃頓的研究也指出,獎勵和即時反饋確實能提高糾錯率,但無法根除認知投降。

即使在最優(yōu)條件下(有金錢激勵、有逐題反饋),AI用戶在面對錯誤AI時的準確率依然從Brain-Only的64.2%降到了45.5%。

所以,「信任但核實」這聽起來很理性,但當AI每天替你處理幾百件事的時候,你根本沒有時間和精力去核實每一件。

而這正是「認知投降」發(fā)生的溫床。

越聰明,越危險

很多人第一反應(yīng)是:這不就是在說AI還不夠好嗎?等技術(shù)迭代幾輪,幻覺率降到足夠低,問題自然解決。

但沃頓的研究揭示了一個更深層的問題:「認知投降」的出現(xiàn),不是因為AI太差,恰恰是因為AI太好。

研究者也承認,「認知投降并不必然是不理性的」。

尤其是在概率推理和海量數(shù)據(jù)處理中,把判斷權(quán)交給一個統(tǒng)計上更優(yōu)越的系統(tǒng),完全有可能給出比人類更好的結(jié)果。

但正是這一點,讓問題變得無解。

AI越強,用戶越依賴;用戶越依賴,糾錯能力越退化;糾錯能力越退化,那些剩下的、更精細的錯誤就越致命。

而且讓AI替你思考,你的推理水平就永遠也不可能超過那個AI。這是一個正反饋所帶來的「死亡螺旋」,一個無法靠技術(shù)迭代解決的bug。

同樣,人類也沒有很好的方法去區(qū)分「該信AI的場景」和「不該信AI的場景」。


就在Summer Yue安裝OpenClaw后郵箱被清空后,AI研究員Gary Marcus曾將這種做法比做「像在酒吧里把電腦密碼和銀行賬戶信息交給一個陌生人?!?/p>

但在真實的AI使用場景里,你往往很難判斷,AI到底值得信任,還是只應(yīng)該像對一個陌生人那樣保持必要的距離。

OpenAI在一篇討論模型幻覺的論文中提到,大模型的幻覺并不只是一個可以修復的bug,更像是模型在既有激勵機制下學會的行為:比起承認「不知道」,它更傾向于給出一個看似完整的答案。


https://openai.com/zh-Hans-CN/index/why-language-models-hallucinate/?utm_source=chatgpt.com

再回到開頭Olson的故事。

當他以為自己的Gmail被盜時,他求助于Gemini。Gemini的回應(yīng)是:「我當然想幫你處理這件事?!?/p>

他沒意識到的是,自己在向一個剛剛制造了麻煩的系統(tǒng)求助,請它處理由它自己造成的問題。

那一刻,他已被AI的幻覺困在一個自洽的閉環(huán)里

Olson說,自己現(xiàn)在對AI的態(tài)度是「信任,但核實」。

可難題是:當AI的輸出比你的判斷看起來更流暢、更自洽,甚至更像「專業(yè)意見」時,你還能拿什么去核實?

當那個替你買朗姆酒的Priscilla,比你的真實朋友更像你的朋友,你又該憑什么分辨?

AI最大的風險,不是它不夠聰明,而是它聰明到當你過于依賴它時,放棄了自己的判斷。

參考資料:

https://www.wsj.com/tech/ai/ai-is-getting-smarter-catching-its-mistakes-is-getting-harder-85612936?mod=ai_lead_pos1

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=6097646

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
轟20+6+5!勇士撿漏23歲222萬奇兵真香:穆迪替身已變庫里新絕配

轟20+6+5!勇士撿漏23歲222萬奇兵真香:穆迪替身已變庫里新絕配

李喜林籃球絕殺
2026-04-16 14:53:53
吳昕帶男友鄭凱與何炅聚餐,曝已相戀7年,比吳昕小兩歲又高又帥

吳昕帶男友鄭凱與何炅聚餐,曝已相戀7年,比吳昕小兩歲又高又帥

阿鳧愛吐槽
2026-04-16 21:39:41
賽力斯汽車“車載便器”專利正式獲批:可解決長途出行內(nèi)急需求

賽力斯汽車“車載便器”專利正式獲批:可解決長途出行內(nèi)急需求

IT之家
2026-04-14 15:10:22
縣城少婦們的幸福感很強

縣城少婦們的幸福感很強

微微熱評
2026-04-11 12:04:02
日本警察廳長官:必須防止強闖中國使館類似事件再次發(fā)生

日本警察廳長官:必須防止強闖中國使館類似事件再次發(fā)生

新京報
2026-04-15 15:58:09
福建贏江蘇8分,浙江勝吉林16分,排名大變,深圳官宣新外援到隊

福建贏江蘇8分,浙江勝吉林16分,排名大變,深圳官宣新外援到隊

老吳說體育
2026-04-16 21:35:16
鎮(zhèn)店之寶不再保密!莫氏雞煲創(chuàng)始人累到想休息,公開全部配方

鎮(zhèn)店之寶不再保密!莫氏雞煲創(chuàng)始人累到想休息,公開全部配方

大魚簡科
2026-04-15 19:49:23
當“買車”不再是唯一答案:楓葉租車正在重構(gòu)汽車消費方式

當“買車”不再是唯一答案:楓葉租車正在重構(gòu)汽車消費方式

WIFI新連接
2026-04-15 20:47:23
10萬億?中國或?qū)⒊蔀槿颍酥寥祟悮v史上,第一個“電力王國”

10萬億?中國或?qū)⒊蔀槿?,乃至人類歷史上,第一個“電力王國”

趣味萌寵的日常
2026-04-16 15:45:47
沒有便血,39歲確診直腸癌

沒有便血,39歲確診直腸癌

中國新聞周刊
2026-04-16 07:35:37
年輕時是帥的教科書,老了卻丑得千姿百態(tài),這6位男神越活越走樣

年輕時是帥的教科書,老了卻丑得千姿百態(tài),這6位男神越活越走樣

八斗小先生
2026-03-28 10:49:09
看完iPhone 18 Pro Max新設(shè)計,手里的手機突然不香了

看完iPhone 18 Pro Max新設(shè)計,手里的手機突然不香了

叮當當科技
2026-04-14 12:41:35
下一個長飛光纖是誰?光通信賽道里,誰最有機會復刻龍頭呢?

下一個長飛光纖是誰?光通信賽道里,誰最有機會復刻龍頭呢?

Thurman在昆明
2026-04-16 15:35:54
《乘風2026》嘉賓趙子琪喊話芒果TV:是逼我爆所有的料嗎,我跟慧雯吵架的視頻是怎么被你們剪輯出來的

《乘風2026》嘉賓趙子琪喊話芒果TV:是逼我爆所有的料嗎,我跟慧雯吵架的視頻是怎么被你們剪輯出來的

魯中晨報
2026-04-16 09:25:03
國際媒體稱:戰(zhàn)火一旦爆發(fā),中國將會爆發(fā)出無人可以想象的實力

國際媒體稱:戰(zhàn)火一旦爆發(fā),中國將會爆發(fā)出無人可以想象的實力

起喜電影
2026-04-16 19:02:43
國務(wù)院決定:免去戴建業(yè)澳門特別行政區(qū)政府經(jīng)濟財政司司長職務(wù)

國務(wù)院決定:免去戴建業(yè)澳門特別行政區(qū)政府經(jīng)濟財政司司長職務(wù)

上觀新聞
2026-04-16 10:56:22
男子曬列車上嬰兒撕心裂肺哭鬧20分鐘,本以為將爆發(fā)沖突,沒想到男子出手30秒哄睡嬰兒,網(wǎng)友:這是本車廂MVP結(jié)算畫面嗎?

男子曬列車上嬰兒撕心裂肺哭鬧20分鐘,本以為將爆發(fā)沖突,沒想到男子出手30秒哄睡嬰兒,網(wǎng)友:這是本車廂MVP結(jié)算畫面嗎?

觀威海
2026-04-15 15:48:30
美國性感女星:受夠了胸罩!我不在乎這對香腸掉到膝蓋

美國性感女星:受夠了胸罩!我不在乎這對香腸掉到膝蓋

可愛小菜
2026-04-16 19:03:27
快船出局遭調(diào)查,小卡淡定回應(yīng):讓我先為輸球哭會兒

快船出局遭調(diào)查,小卡淡定回應(yīng):讓我先為輸球哭會兒

仰臥撐FTUer
2026-04-16 20:12:05
不是迷信!明日三月初一,牢記:1不去,2不吃,3要忌,別大意了

不是迷信!明日三月初一,牢記:1不去,2不吃,3要忌,別大意了

小娟教做菜
2026-04-16 15:00:05
2026-04-16 22:27:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14986文章數(shù) 66773關(guān)注度
往期回顧 全部

科技要聞

趙明:智駕之戰(zhàn),看誰在大模型上更高效

頭條要聞

上海業(yè)主傻眼 安保、保潔突然全離崗小區(qū)垃圾堆積成山

頭條要聞

上海業(yè)主傻眼 安保、保潔突然全離崗小區(qū)垃圾堆積成山

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰生意迷霧

汽車要聞

空間大五個乘客都滿意?體驗嵐圖泰山X8

態(tài)度原創(chuàng)

藝術(shù)
游戲
房產(chǎn)
本地
軍事航空

藝術(shù)要聞

張大千『 花菓薈萃冊』

PS5版優(yōu)化堪憂!《星空》Switch 2版本再泄露

房產(chǎn)要聞

人人人人!封關(guān)后首屆消博會,擠爆了!

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

軍事要聞

封鎖霍爾木茲海峽后 美釋放雙重信號

無障礙瀏覽 進入關(guān)懷版