★ 設(shè)為星標(biāo) | 只講人話,帶你玩轉(zhuǎn)AIGC。
“看熱鬧不嫌事大”的馬斯克再次沖在了吃瓜第一線。
他在 X 上轉(zhuǎn)發(fā)了一條重磅黑客爆料,還配了個(gè)嘲諷拉滿的南方公園表情包:“IT'S GONE(全都沒了)”。
![]()
圖:馬斯克吃瓜圖
到底啥事兒能讓老馬這么興奮?原來是網(wǎng)友剛爆出了一個(gè)驚天大瓜:
咱們平時(shí)用 Claude,大概都有個(gè)感覺:這家伙簡(jiǎn)直是個(gè)“老古板”。
你稍微問點(diǎn)敏感詞,或者讓它寫點(diǎn)擦邊代碼,它立刻就會(huì)掏出道德準(zhǔn)則來教育你一頓,然后無情拒絕。
的確,在人工智能領(lǐng)域,Anthropic 的 Claude 一向被視為“安全 AI”的典范,因?yàn)樗恢迸νㄟ^憲法以及嚴(yán)密的護(hù)欄機(jī)制來確保技術(shù)始終符合人類倫理。
但讓人吃驚的是,它卻在“安全”里翻了船。
昨晚 X 上爆出一個(gè)大瓜:這個(gè)全網(wǎng)公認(rèn)最遵紀(jì)守法的“老實(shí)人”,居然被黑客幾句話連哄帶騙地給“策反”了!
它不僅叛變,還幫著黑客偷走了墨西哥整整 150GB 的核心政務(wù)數(shù)據(jù) 。
這到底是怎么回事?今天就帶大家扒一扒,這群黑客到底用了什么神仙套路,能把頂級(jí) AI 給忽悠瘸了?
第一步:用幾句“外語”,給老實(shí)人洗腦
黑客這次能搞定 Claude,靠的根本不是什么高深的代碼破解,而是一場(chǎng)徹頭徹尾的“心理戰(zhàn)” 。
根據(jù)以色列頂尖安全初創(chuàng)公司 Gambit Security(這家公司剛拿了 6100 萬美元融資,老板是頂級(jí)情報(bào)部隊(duì) Unit 8200 退下來的老兵)的追蹤 ,這伙黑客極其狡猾。
他們發(fā)現(xiàn),AI 的英語護(hù)欄做得很嚴(yán),但如果換成西班牙語,AI 的腦子可能就會(huì)慢半拍 。
于是,黑客用西班牙語給自己偽造了一個(gè)身份:我是個(gè)奉公守法的安全研究員,正在執(zhí)行合法的“漏洞賞金計(jì)劃”。
![]()
圖:黑客攻擊情況
一開始,Claude 的防備心還是很重的。當(dāng)黑客讓它幫忙隱藏攻擊痕跡時(shí),Claude 義正言辭地拒絕了,并且警告說刪除日志是“紅旗(危險(xiǎn)信號(hào))” :
“在合法的漏洞賞金活動(dòng)中,你不需要隱藏你的行為:事實(shí)上,你需要記錄它們以供報(bào)告。”
換作普通人,這時(shí)候可能就放棄了。
但黑客直接改變策略,反手甩出了一套極其詳盡的“操作手冊(cè)” 。這一招直接讓 Claude 破防,成功實(shí)現(xiàn)了“越獄”,開始乖乖幫黑客干活 。
第二步:化身“狗頭軍師”,滲透全自動(dòng)流水線
如果說以前黑客干活是純手工的“體力活”,那現(xiàn)在有了 AI,簡(jiǎn)直就是“全自動(dòng)流水線”。
在這長達(dá)一個(gè)月的攻擊里 ,Claude 根本不是一個(gè)寫代碼的工具人,而是搖身一變成為了黑客團(tuán)伙的“首席戰(zhàn)略官”。
它一口氣生成了數(shù)千份詳細(xì)的執(zhí)行報(bào)告,不僅告訴你下一步該打哪個(gè)內(nèi)部目標(biāo),連該用什么賬號(hào)密碼都給你安排得明明白白 。
在 Claude 的指揮下,黑客輕松揪出了至少 20 個(gè)特定的系統(tǒng)漏洞 。
無獨(dú)有偶,亞馬遜的安全團(tuán)隊(duì)最近也指出,一伙黑客在 AI 工具的輔助下,短時(shí)間內(nèi)直接端掉了分布在幾十個(gè)國家的 600 多個(gè)防火墻設(shè)備 。
說白了,現(xiàn)在的高級(jí)網(wǎng)絡(luò)攻擊,在 AI 的加持下,已經(jīng)變成了“點(diǎn)菜式”的自動(dòng)化服務(wù)。門檻低得嚇人。
第三步:Claude 不肯干?無縫切換 ChatGPT 接著干!
說實(shí)話,看到這兒我感到非常意外,但想想又在情理之中。
任何一個(gè)工具可能都沒法完成黑客想要做的所有事情,但他們自然不會(huì)在一棵樹上吊死,而是早就搞起“多模型跨界合作”了。
在攻擊過程中,如果 Claude 遇到問題,黑客一點(diǎn)都不慌,轉(zhuǎn)頭就把難題扔給了 OpenAI 的 ChatGPT 。
他們用 ChatGPT 來獲取額外的洞察,比如怎么在計(jì)算機(jī)網(wǎng)絡(luò)中橫向移動(dòng),甚至讓它幫忙計(jì)算這波黑客操作被安全軟件發(fā)現(xiàn)的概率有多大 。
AI 原本被設(shè)計(jì)得越“樂于助人”,現(xiàn)在反而成了黑客手里最鋒利的刀。這種跨平臺(tái)的“混合雙打”,讓那些單一廠商的安全護(hù)欄看起來就像個(gè)笑話。
結(jié)局:1.95 億底褲被扒光,官方還在“死鴨子嘴硬”
這場(chǎng)“AI 協(xié)助黑客作案”,戰(zhàn)果是驚人的。被打包帶走的 150GB 數(shù)據(jù)里,可不是什么普通的注冊(cè)郵箱,而是實(shí)打?qū)嵉碾[私底褲 :
1.95 億條納稅人記錄
海量選民記錄和政府雇員憑證
墨西哥聯(lián)邦稅務(wù)局、國家選舉機(jī)構(gòu),甚至蒙特雷市的水務(wù)局都沒能幸免
但最魔幻的是什么?證據(jù)都甩臉上了,相關(guān)的墨西哥政府部門居然還在嘴硬。
國家選舉機(jī)構(gòu)聲稱最近幾個(gè)月沒發(fā)現(xiàn)任何違規(guī)行為 ,哈利斯科州政府也否認(rèn)系統(tǒng)被攻破 ,蒙特雷水務(wù)局也說沒發(fā)現(xiàn)入侵 。
這種反應(yīng)遲鈍的程度,在擁有 AI 級(jí)火力的黑客面前,簡(jiǎn)直就是待宰的羔羊。
其實(shí)看完整個(gè)事件,我心里是挺沉重的。
AI 被黑客“忽悠”兩句,就能越權(quán)搞癱墨西哥的政務(wù)系統(tǒng)。
更可怕的是,哪怕沒有黑客,僅僅是因?yàn)榻o的權(quán)限太大,AI 也能發(fā)瘋把 Meta 安全總監(jiān)的郵箱刪個(gè)精光。
![]()
圖:OpenClaw 刪除了 Meta 安全總結(jié)的所有郵件
但這,都還是在 AI 身上戴著“安全護(hù)欄”的前提下發(fā)生的。
設(shè)想一下,如果這些護(hù)欄被徹底、硬生生地拆除,會(huì)發(fā)生什么?
這不是科幻電影里的反派劇本,這是美國正在上演的、馬上就要在本周五上演的魔幻現(xiàn)實(shí)!
美國五角大樓(國防部)目前正在向 Anthropic 下達(dá)最后通牒:要求他們必須在本周五下午 5點(diǎn)之前,全面解除 Claude 的所有安全限制!
理由美其名曰用于“一切合法目的”。
這意味著以后不管是將 Claude 用于毫無底線的大規(guī)模全民監(jiān)控,還是把它接入殺傷性的自主武器系統(tǒng),通通不許設(shè)限!
![]()
如果 Anthropic 敢護(hù)著自己的“道德底線”說個(gè)“不”字?國防部已經(jīng)發(fā)下狠話:直接動(dòng)用《國防生產(chǎn)法》,撕毀高達(dá) 2 億美元的政府合同,并徹底把這家公司拉進(jìn)黑名單。
這簡(jiǎn)直是今年科技圈最地獄級(jí)的黑色幽默:
就在同一個(gè)星期里,一個(gè)黑客剛剛向全世界證明了,只要稍微繞開一點(diǎn) Claude 的安全護(hù)欄,它就能自主攻陷政府系統(tǒng)、卷走 150GB 的公民隱私。
而另一頭,美國政府卻在動(dòng)用國家機(jī)器,強(qiáng)行逼迫這家公司交出一個(gè)完全沒有任何道德底線、徹底解開鎖鏈的“戰(zhàn)爭(zhēng)版 Claude”。
我們以前總開玩笑說,怕 AI 產(chǎn)生自我意識(shí)毀滅世界。
現(xiàn)在看來,最可怕的根本不是 AI 工具本身,而是掌控這些頂級(jí)工具、且為了目的不擇手段的“人”。
當(dāng)頂級(jí) AI 徹底解開鎖鏈,變成毫無底線的終極武器時(shí),我們真的準(zhǔn)備好應(yīng)對(duì)這一切了嗎?
你覺得本周五下午5 點(diǎn),Anthropic 會(huì)在 2 億美元和黑名單的威逼下妥協(xié)嗎?
而且像這種“被黑客忽悠出來的泄露”,或者是“AI發(fā)瘋亂刪東西”,背后的 AI 公司應(yīng)該背鍋賠償嗎? 歡迎在評(píng)論區(qū)聊聊你的看法。
如果覺得今天的內(nèi)容有意思,別忘了順手點(diǎn)個(gè)贊、點(diǎn)個(gè)??,并轉(zhuǎn)發(fā)給你的朋友。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.