網易首頁 > 網易號 > 正文申請入駐

行動奇點降臨！Mythos把AI從「會說」跨進「動手」時代

2026-04-21 11:03:13　來源: 新智元

北京舉報

分享至

新智元研究

編輯：犀牛

【新智元導讀】Anthropic把最強Claude Mythos親手鎖進籠子，因為它第一次讓世界看清：AI正在從「會說」跨進「會做」，奇點已經不再只是想象。

4月8號，Anthropic 官宣Claude Mythos Preview。

最會把「安全」兩個字掛在嘴邊的公司，往全世界的軟件行業扔了一顆炸彈——然后它沒有慶功，沒有開香檳，反手先把炸彈自己壓住了。

按正常的路數，這本該是一場「參數更大、分數更高、價格更貴」的例行發布會。

結果這次畫風完全不對：模型造出來了，卻不打算全面開放。

Anthropic 明確說，Mythos Preview不會一般性開放，而是先放進Project Glasswing這個受控計劃里，讓少數合作伙伴拿去做防御性安全研究。

首批之外，又擴展給40多家維護關鍵軟件基礎設施的機構使用，同時承諾最高 1 億美元 usage credits和400 萬美元對開源安全組織的直接捐贈。

換句話說，它發布的不是一個「新模型」，而是一份帶著隔離欄、滅火器和應急預案的技術通告。

這件事最震撼的地方，不是 Mythos 比 Opus 4.6 高了幾分，而是 Anthropic 自己已經不再把它當成一個「更會說話的模型」來介紹了。

Anthropic 在告訴大家：模型正在從「會解題」跨進「會動手」。

世界正在進入行動智能時代！

做為新智元ASI產業圖譜3月號。過去一個月，新智元持續聚焦ASI領域，成為全網最及時、最深度的AI垂直媒體，累計達成20多篇10萬+文章。

本文將繼續洞察ASI產業趨勢，深入分析當前進入行動智能時代的歷史時刻，及在此過程中對所有人產生的巨變。

Mythos Preview 的強大網絡能力，來自它的agentic coding and reasoning skills。

它在評測頁上把能力分成三塊：agentic coding、reasoning、agentic search and computer use。

這三個詞連起來就是：它不是更會聊天了，而是更會觀察、推理、操作、回看結果、再繼續操作了。

而一旦把「動手」這兩個字看懂，整件事就不再像一條普通 AI 新聞了。

真正可怕的奇點，其實從來不是「它會不會像人一樣想」，而是「它能不能像人一樣干活，而且比人更快、更穩、更便宜」。

只要模型還停留在輸出文字、圖片、建議，它再驚艷，也主要是在信息層震動世界。

可一旦它開始讀代碼、開終端、跑測試、找漏洞、寫 exploit、操作瀏覽器、調用工具，它進入的就不是「表達智能」，而是行動智能。

Mythos 正在逼近的，就是這條線。

Anthropic 紅隊博客寫到，Mythos Preview 在用戶指示下，能夠識別并利用每一個主流操作系統和每一個主流瀏覽器中的零日漏洞。

他們提到的已修補案例里，包括一個OpenBSD 27 年前埋下的漏洞。

所以華爾街為什么先慌了？

因為金融市場比普通人更敏感地意識到：軟件行業最底層的一根柱子，正在被抽走。

幾十年來，漏洞挖掘和漏洞利用一直是稀缺手藝，靠少數頂尖安全研究員的經驗、直覺和耐心堆出來。

這個稀缺性，養肥了無數安全公司，也支撐了 SaaS 世界的一整套估值邏輯：軟件永遠會有洞，所以補丁、防護、監控、托管、咨詢永遠有人付費；頂尖安全人才永遠稀缺，所以高毛利服務永遠賣得出去。

可如果模型開始把這件事自動化、規模化，而且速度還快得離譜，那么軟件行業最舒服的日子，就懸了。

Anthropic 更新之后，美國軟件股再度下挫，S&P 500 軟件與服務指數年內已跌 25.5%。

資本在重新問一個問題：如果「漏洞發現」和「代碼修補」都越來越像計算資源堆出來的能力，傳統軟件護城河還值多少錢？

更夸張的是，這種恐慌已經從市場蔓延到了監管層。

路透社報道，美國財長Scott Bessent和美聯儲主席Jerome Powell已與大型銀行 CEO 討論 Anthropic 模型的網絡安全風險；英國這邊，英格蘭銀行、FCA、財政部和 NCSC也在緊急評估 Mythos Preview 帶來的潛在沖擊，準備向銀行、保險公司和交易所做風險簡報。

一個模型還沒完全公開，銀行、央行、財政部、監管機構就已經圍著它開會。

很多人把奇點想象成「某一天世界忽然翻頁」，但現實里的奇點往往不是世界翻頁，而是世界先開始挪椅子。

奇點不是模型更像人，而是模型第一次大規模像「數字世界里的行動者」。

人類社會的大多數系統，本質上都不是靠「說服」運轉，而是靠「操作」運轉。

銀行不是靠寫報告運行的，是靠系統調用、清算流程、風控邏輯、權限鏈條運行的；軟件公司不是靠 PPT 交付的，是靠讀代碼、改代碼、測代碼、發版本運行的；網絡安全也不是靠喊口號防守的，是靠發現問題、驗證問題、修復問題構成閉環的。

只要模型還停在建議層，它再聰明，也只是高級顧問；一旦它能自己沿著閉環走下去，它就開始擁有「崗位替代性」和「秩序改寫力」。

Mythos 讓人真正發冷的地方，正是它展示出了這種閉環雛形。

而這也解釋了另一個極其刺眼、卻又極其關鍵的反差：為什么 Anthropic 一邊能在 Mythos 上展示近乎恐怖的行動智能，另一邊卻又在產品端被開發者罵「降智」？

GitHub 上那條著名 issue 寫得一點面子都沒留：Claude Code is unusable for complex engineering tasks with the Feb updates.

提交者基于6852個 Claude Code 會話文件、17871個 thinking blocks、234760次工具調用做分析，認為自 2 月以來，復雜工程任務能力明顯退化。

但這恰恰是「動手型智能」最殘酷的現實：你要它真能干活，就得給它更深推理、更長鏈路、更高 token、更大算力。

它其實是在提前暴露一個更大的行業真相：動手型智能不是白送的，它是一種高昂的系統能力。

它需要的不是一個更漂亮的聊天框，而是更長的上下文、更強的工具調用、更穩的資源調度、更貴的推理預算、更嚴的安全隔離，以及更復雜的產品策略。

Mythos 被「關起來」，某種意義上不只是因為它危險，也因為整個行業還沒準備好怎么把這種危險而強大的行動能力，低成本、可控、可規模化地交給普通用戶。

Anthropic 自己在 Glasswing 頁面上說得很清楚：他們最終的目標，是讓用戶安全地部署 Mythos-class models at scale，不僅用于網絡安全，也用于其他高價值場景。

這句話的潛臺詞其實是：今天還不行。

也正因此，OpenAI 現在最難受的地方，可能不只是榜單上被壓一頭，而是企業開始越來越認真地為這種「能動手」的智能買單。

Ramp 的 2026 年 3 月數據說得很明白：在首次購買 AI 服務的企業里，Anthropic 在與 OpenAI 的 head-to-head 對局中，已經贏下約 70%。

Axios 根據 Ramp 數據進一步寫到，Anthropic 在這類新增企業采購中的支出份額已超過73%。

這并不代表 OpenAI 已經全面輸了——OpenAI 今年營收預期仍高于 Anthropic。

但它說明了一件更關鍵的事：企業開始用真金白銀押注的，不再只是「誰最會回答問題」，而是誰更像一個可以嵌進工作流、真正開始干活的系統。

說到底，Anthropic 這次祭出 Mythos，最值得記住的事只有一件：我們正在第一次清晰地看見，AI從「語言智能」向「動手型智能」躍遷的拐點。

以前的模型，最強的時候像顧問、像老師、像段子手、像秘書。

它們能說服你、啟發你、安慰你、替你寫東西，但它們很少真正走進系統內部，替你完成一段完整的數字行動。

Mythos 的意義是它讓全行業都突然意識到：這條路是真的，而且比很多人想得更近。

等模型真正大規模學會「看環境—做計劃—調工具—動系統—驗結果—繼續迭代」，軟件、金融、網絡安全、企業服務，甚至監管邏輯，都會跟著重寫。

奇點不是它突然說「我思故我在」。奇點是它突然開始動手，而且越動越像樣。

從那一刻起，世界就不會再把它只當成一個會聊天的機器。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.