![]()
作者 | 木子
Anthropic“手滑”泄露了最強(qiáng)新模型,但更戲劇的是,他們本來還不太敢發(fā)。
因為這個模型發(fā)現(xiàn)漏洞、攻擊漏洞的“黑客能力”太強(qiáng)了。
據(jù)《財富》消息,Anthropic 在未公開的草稿中指出:
“與此前最強(qiáng)模型 Claude Opus 4.6 相比,Capybara(卡皮巴拉,新模型的內(nèi)部代號)在軟件編程、學(xué)術(shù)推理和網(wǎng)絡(luò)安全等測試中取得了顯著更高的分?jǐn)?shù)。”
![]()
這個“卡皮巴拉”其實還有個真名,叫“Claude Mythos”(直譯過來就是“神話”)。
目前,Anthropic 的 Claude 模型分為三檔:
Opus:最大、最強(qiáng)
Sonnet:次強(qiáng)、更快更便宜
Haiku:最小、最快、最便宜
而“神話”Mythos,“模”如其名,確實也是一個比 Opus 更強(qiáng)、更昂貴的新層級。
![]()
從表面上看,Mythos 在編程、推理,以及網(wǎng)絡(luò)安全測試中的表現(xiàn)提升,像是三項獨立能力的增強(qiáng)。但在安全領(lǐng)域,這三者實際上恰恰能構(gòu)成一條完整的“攻擊能力鏈”:
首先,編程能力決定模型能不能真正“看懂系統(tǒng)”:不僅是讀代碼,還包括理解模塊之間如何交互、邏輯是怎么實現(xiàn)的;而且還可以在需要時,把這些理解轉(zhuǎn)化為可執(zhí)行的利用代碼(exploit)或自動化腳本。
其次,強(qiáng)悍的推理能力可以做“攻擊路徑的規(guī)劃”:在一個由多個組件組成的系統(tǒng)里,模型需要一步步推導(dǎo),比如從哪里切入、如何繞過限制、怎樣逐步提權(quán),最終觸達(dá)真正有價值的目標(biāo)。
最后網(wǎng)絡(luò)安全相關(guān)能力的顯著提升,從另一方面而言,也說明模型對漏洞類型、安全機(jī)制以及可利用性的理解更深入。也就是說,模型也更擅長發(fā)現(xiàn)漏洞然后“鉆空子”。
這有點像一個人對法律理解越深入,就越清楚規(guī)則的邊界在哪里:既知道什么是違規(guī),也知道在什么條件下可能繞過。
消息一出,Anthropic 也是緊急關(guān)閉了相關(guān)信息的公開訪問與檢索功能,并稱這屬于內(nèi)容管理系統(tǒng)(CMS)配置的“人為錯誤”。不過有更加眼疾手快的網(wǎng)友,趕在官方刪除前保存了一份。
![]()
Anthropic 泄露 3000+
未發(fā)布文件
實際上,Anthropic 這次意外泄漏的,一共有 3000 多個未發(fā)布內(nèi)容資源(包括頁面、圖片、PDF 等),且均可被公眾訪問。
起初,這事是被二位網(wǎng)絡(luò)安全研究員發(fā)現(xiàn)的,其中一位來自一家網(wǎng)絡(luò)安全公司,另一位來自劍橋大學(xué)。
據(jù)安全研究人員透漏,這些材料(包括疑似用于發(fā)布新模型的博客草稿),被存放在了一個未加保護(hù)的公共數(shù)據(jù)湖中。
也就是說,它們本來應(yīng)該被存放在 Anthropic 的內(nèi)容管理系統(tǒng)(CMS)中。但由于配置失誤,相關(guān)內(nèi)容在上傳后被默認(rèn)生成了可公開訪問的 URL,且未設(shè)置訪問權(quán)限,結(jié)果被搜索引擎抓取,形成了一個可被外界檢索的數(shù)據(jù)緩存。
Anthropic 在文檔中指出,他們已經(jīng)完成了Claude Mythos的訓(xùn)練,并稱其為:“迄今為止我們開發(fā)過的最強(qiáng) AI 模型。”
但他們也在文中表示:
“在準(zhǔn)備發(fā)布 Claude Mythos 時,我們希望采取更加謹(jǐn)慎的態(tài)度,全面理解其帶來的風(fēng)險——不僅限于我們內(nèi)部測試中已經(jīng)發(fā)現(xiàn)的部分。尤其是,我們希望重點評估該模型在網(wǎng)絡(luò)安全領(lǐng)域的短期潛在風(fēng)險,并將相關(guān)結(jié)果分享出來,幫助網(wǎng)絡(luò)防御方提前做好準(zhǔn)備。 Mythos 同時也是一個規(guī)模龐大、計算密集型的模型。無論是對我們來說,還是對客戶而言,其部署和使用成本都將非常高。因此,在全面發(fā)布之前,我們正在努力提升模型的效率。 基于這些原因,我們在發(fā)布 Mythos 時將采取比以往更慢、更漸進(jìn)的策略。我們會先從一小部分早期訪問客戶開始,讓他們探索該模型在網(wǎng)絡(luò)安全方面的應(yīng)用,并反饋實際發(fā)現(xiàn)。”
![]()
除了意外曝光全新頂級模型 Mythos,這些文件還透露出,Anthropic 將在英國舉辦一個閉門活動,面向歐洲最具影響力的 CEO,而且 CEO Dario Amodei 將出席。
該活動為期兩天,定位為“小規(guī)模深度交流” ,內(nèi)容包括: 政策制定者分享 AI 應(yīng)用趨勢,以及體驗尚未發(fā)布的 Claude 功能。
這次泄露之所以格外敏感,或者也和整個 AI 行業(yè)正在跨過一個臨界點有關(guān)。
過去一年,頭部模型的能力已經(jīng)不只是“更會寫代碼”,而是開始具備直接作用于真實系統(tǒng)的能力。
比如今年 2 月,OpenAI 發(fā)布的 GPT-5.3 Codex,已被認(rèn)定為“高網(wǎng)絡(luò)安全能力模型”,可以直接用于發(fā)現(xiàn)軟件漏洞;同期,Anthropic 的 Opus 4.6 也已經(jīng)能夠在生產(chǎn)環(huán)境中識別未知漏洞。
而這類能力,本質(zhì)上就是的“雙刃劍”。Anthropic 曾披露,已有具備國家背景的黑客組織,曾嘗試?yán)?Claude 發(fā)起攻擊。在一次事故中,對方借助 Claude Code 滲透了約 30 家機(jī)構(gòu)(包括科技公司、金融機(jī)構(gòu)和政府部門),Anthropic 不得不在 10 天內(nèi)完成排查、封禁賬號,并通知相關(guān)組織。
放在這樣的背景下,再看 Mythos,就不只是一個更強(qiáng)的模型,而是一個已經(jīng)逼近現(xiàn)實攻防邊界的能力形態(tài)。
One More Thing
微妙的是,在這起泄露被曝光的同時,據(jù) Information 消息,Anthropic 正在推進(jìn) IPO 計劃,預(yù)計最快在今年第四季度上市。
如果說 Mythos 體現(xiàn)了目前模型能力上限,那么這次泄露事件也同時暴露了另一件事:當(dāng)模型能力逼近現(xiàn)實系統(tǒng)邊界時,AI 公司需要面對的,已經(jīng)不只是“能不能做出來”,而是“能不能安全地發(fā)布”。
https://fortune.com/2026/03/26/anthropic-says-testing-mythos-powerful-new-ai-model-after-data-leak-reveals-its-existence-step-change-in-capabilities/
https://x.com/M1Astra/status/2037377109472018444
https://www.theinformation.com/articles/anthropic-discusses-going-public-soon-fourth-quarter
聲明:本文為 AI 前線整理,不代表平臺觀點,未經(jīng)許可禁止轉(zhuǎn)載。
會議推薦
OpenClaw 出圈,“養(yǎng)蝦”潮狂熱,開年 Agentic AI 這把火燒得不可謂不旺。在這一熱潮下,自托管 Agent 形態(tài)迅速普及:多入口對話、持久記憶、Skills 工具鏈帶來強(qiáng)大生產(chǎn)力。但這背后也暴露了工程化落地的真實難題——權(quán)限邊界與隔離運行、Skills 供應(yīng)鏈安全、可觀測與可追溯、記憶分層與跨場景污染、以及如何把 Agent 納入團(tuán)隊研發(fā) / 運維流程并形成穩(wěn)定收益。
針對這一系列挑戰(zhàn),在 4 月 16-18 日即將舉辦的 QCon 北京站上,我們特別策劃了「OpenClaw 生態(tài)實踐」專題,將聚焦一線實踐與踩坑復(fù)盤,分享企業(yè)如何構(gòu)建私有 Skills、制定安全護(hù)欄、搭建審計與回放機(jī)制、建立質(zhì)量 / 效率指標(biāo)體系,最終把自托管 Agent 從可用的 Demo 升級為可靠的生產(chǎn)系統(tǒng)。
今日薦文
你也「在看」嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.