網易首頁 > 網易號 > 正文申請入駐

剛剛，Claude Opus 4.7突然發布：不是最強，但奧特曼又得失眠

2026-04-17 01:35:26　來源: 愛范兒

廣東舉報

分享至

今年 Anthropic 的勢頭異常兇猛。

不僅熱度居高不下，口碑也持續攀升，穩坐 AI 圈「頂流」的交椅。現在幾乎每天醒來，都能看到他們準點推送的新產品或新功能。久而久之，大家也從興奮變成了「是你，果然又是你」的默契感。

而就在剛剛，萬眾期待的 Claude Opus 4.7 也正式發布，依舊是熟悉的配方，熟悉的高分選手。

有趣的是，Anthropic 在公告里非常坦誠，甚至帶著點驕傲：「這并非我們最強大的模型。」那個傳說強得可怕的 Claude Mythos Preview 依然還在藏。

但就是這個并非最強的 Opus 4.7，卻依舊引發了極大的關注。因為它解決了一個比聰明更重要的痛點：靠譜。不是那種你說什么它就做什么的靠譜，而是當你提出一個愚蠢的方案時，它敢于反駁你，并自己把坑填上的靠譜。

當靠譜成為比聰明更稀缺的品質

基準測試結果顯示，在業界公認最硬核的 SWE-bench Pro 上，4.7 從前代的 53.4% 直接拉到 64.3%，單代升級漲了近 11 個百分點，把 GPT-5.4（57.7%）和 Gemini 3.1 Pro（54.2%）都甩在了身后。

視覺推理的 CharXiv 基準從 69.1% 跳到 82.1%，對應的是它新獲得的 2576 像素長邊識別能力——清晰度是前代的 3 倍以上。

這不只是「看得更清楚」這么簡單。更高的分辨率直接帶動了輸出質量的連鎖提升：生成界面、制作幻燈片、排版文檔，細節精度也全面提升。

工具調用規模化評測 MCP-Atlas 上，4.7 跑出 77.3%，超過 GPT-5.4 的 68.1% 和 Gemini 的 73.9%。法律 AI 平臺 Harvey 測試中，4.7 在 BigLaw 基準上拿下 90.9%，正確區分了歷來是前沿模型死穴的「轉讓條款」與「控制權變更條款」。

不過，4.7 也并非全然遙遙領先，在 Agentic search 評測 BrowseComp 上，4.7 反而從前代的 83.7% 下降到了 79.3%，被 GPT-5.4（89.3%）和 Gemini（85.9%）超越。

這個退步并非偶然。一個遇到缺失信息會直接報錯、不肯亂編答案的 Agent，在以「是否給出答案」為評判標準的基準上，天然會吃虧。

而數據之外，更值得關注的問題是：這種「靠譜」，在真實工作里到底意味著什么？

過去一年，業界對代碼大模型的期待，普遍還停留在「寫個函數、找個 Bug」的層面，但 Claude 4.7 在早期測試里，展現出了一種截然不同的氣質。

知名云端開發平臺 Replit 的負責人這樣描述：「它在技術討論中會反駁我，幫我做出更好的決定。它真的感覺像一個更好的同事。」

它不再一味地「唯命是從」，也不再為了交差而胡編亂造。在數據科學平臺 Hex 的測試里，4.7 遇到缺失數據時會直接報錯，而不是像前代那樣塞一個「看似合理但完全錯誤」的備選值。Hex 團隊甚至直言：「低消耗狀態下的 4.7，等同于中等消耗狀態下的 4.6。」

這種「拒絕順從」的特質，恰恰是高級軟件工程里最稀缺的東西。

當然，凡事有兩面。為舊模型寫的 prompt，到了 4.7 手里可能會產生意想不到的結果。那些過去被模型「意會」掉的模糊指令，4.7 會一字一字地字面執行。這也意味著越懂得清楚表達需求的人，越能從 4.7 這里拿到好結果。

光會「頂嘴」還不夠，遇到挫折就罷工的 AI 同樣不是好同事。4.7 的另一個大的變化，是任務韌性。

以往大模型在多步任務中遇到工具調用失敗，往往直接停機報錯。Notion 團隊測試發現，4.7 的工具錯誤率降到了原來的三分之一，更關鍵的是，它能在工具鏈崩潰時自己繞過障礙，繼續把任務跑完。

當 AI 停止諂媚，真正的生產力才開始爆發。

Anthropic 公布的一個極端案例里，4.7 在沒有任何人類干預的情況下，從零構建了一個完整的 Rust 文本轉語音引擎——寫神經網絡模型、SIMD 內核和瀏覽器演示，還自己把輸出喂給語音識別器做驗證，連測試都一并完成了。

前端框架巨頭 Vercel 還發現了一個過去從未有過的行為：4.7 會在開始寫系統級代碼之前，先自己進行數學證明。這已經超出了寫代碼的范疇，進入了嚴謹工程設計的領域。

雇傭 AI「資深專家」的代價

為了驗證它在細節上的處理能力，我設定了三個前端交互場景，評判標準只有一個：細節是否敷衍，一眼便知。

第一個場景，是讓它做一個俯視視角的黑膠唱片機界面，其難點在于「金屬光澤」與「呼吸光暈」的呈現。4.7 并沒有用廉價的色彩漸變敷衍了事，而是通過復雜的 CSS 樣式疊加，逼真地還原了金屬質感。

第二個場景是只用 CSS，不用 JavaScript 做一個老式電風扇。面對這個限制嚴格的題目，一些模型會悄悄違規使用 JS，但 4.7 遵守了規則。它用純 CSS 做出了風扇的立體結構，低中高三檔過渡流暢，底座透視和陰影的處理也真有一點實物感，它在規則允許的范圍內找到了很好的解決辦法。

第三個場景是做一個復古磁帶隨身聽，帶有錄像帶那種老舊的噪點效果。磁帶轉動的細節也是有的。

當然，變聰明是有代價的。Opus 4.7 現已在所有 Claude 產品和 API、Amazon Bedrock、Google Cloud 的 Vertex AI 以及 Microsoft Foundry 平臺上推出。

基礎定價維持在每百萬輸入 5 美元、輸出 25 美元不變。但 4.7 引入了全新分詞器，同樣的文本會拆分出比原來多 1.0 到 1.35 倍的 Token。

疊加上它在高強度任務中本身就傾向于「多想一會兒」，實際消耗幾乎必然上升。

此外，Anthropic 在原有的難度選項之上，加入了全新的 xhigh（超高）級別。在這個級別下，面對復雜難題，Claude 4.7 會消耗更多的 Token，花更多的時間去「思考」。Claude Code 已經把所有套餐的默認 effort level 直接拉到了 xhigh。

Anthropic 用行動告訴所有人，對于真正的編碼任務，省著用不如想清楚。

為了匹配這種工作流，Claude Code 順勢推出了兩個殺手級功能：

/ultrareview（深度審查）：開啟一個專門的審查會話，像一個極其挑剔的資深 Reviewer 一樣，通讀所有代碼更改，精準標記出深層的架構設計缺陷和 Bug。Pro 和 Max 用戶可以免費試用三次。

Auto Mode（自動模式）擴展到 Max 用戶：一種介于「逐項授權」和「跳過所有權限」之間的新權限模式。Claude 會在你授權的范圍內自主做決策，既能跑完漫長無聊的任務，又比完全放權更安全。

為了防止這個「太能思考」的 AI 把賬戶余額刷爆，API 端還推出了「任務預算」（Task Budgets）功能公測版，讓開發者可以顯式規劃 Claude 在長任務中的 Token 支出優先級。

當然，4.7 并不是 Anthropic 手里最強的牌。

那個更強的 Claude Mythos Preview，本月剛以「Project Glasswing」的名義，小范圍開放給了一批企業用于網絡安全研究。Mythos 沒有公開發布，原因則是因為它的網絡攻防能力太強，Anthropic 覺得還沒想清楚怎么安全地推給所有人。

4.7 本身也做了主動取舍，訓練階段就壓低了網絡攻防能力，內置自動攔截機制，碰到高風險請求直接擋掉。有合規需求的安全研究人員，可以通過官方渠道單獨申請。

不急著把最強的牌打出去，和不停地往桌上加新牌，背后是同一套邏輯。實際上，Anthropic 真正的護城河，是交付節奏本身。

在今年 2 月 1 日至 3 月 24 日，短短 52 天里，Anthropic 一共更新了 74 款產品，平均不到兩天一個。Cowork、插件……這些動作扎扎實實地擊中了職場辦公的痛點。

如今的 Claude 生態，早就超越了單純的「聊天機器人」。對于那些渴望將 AI 深度嵌入實際工作流的團隊而言，這種穩定、高頻且可預期的更新節奏，才是最讓人感到踏實的定心丸。

今天發布的 Claude 4.7，是這條鏈條上最新的一塊壓艙石。而那個 Mythos Preview，遲早也會來。到那時候，我們現在覺得已經很能打的 4.7，可能只是個開端。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

史詩級進化，OpenAI「超級龍蝦」震撼上線！

雷科技 2026-04-17 09:28:55
0 跟貼 0
Anthropic發布Claude Opus 4.7：金融分析能力登頂公開模型軟件工程、多模態全面進階

財聯社 2026-04-17 01:18:06
13 跟貼 13

AI視頻混戰升級，字節在模型之外加了道防線

鈦媒體APP 2026-04-16 19:28:13
1 跟貼 1

OpenAI新增智能體后臺操作電腦應用功能推進超級應用布局

財聯社 2026-04-17 03:27:26
0 跟貼 0
AI安全得查祖宗三代？Anthropic登Nature揭秘大模型潛意識傳染

新智元 2026-04-16 18:50:56
0 跟貼 0

人人都能用的本地 AI？我們拿千元機測了一下，結果拉完了

雷科技 2026-04-17 09:34:59
0 跟貼 0

賦能數智發展共筑安全防線 —— 世界互聯網大會亞太峰會人工智能與網絡安全能力建設高級研修班綜述

鈦媒體APP 2026-04-17 10:12:07
0 跟貼 0
匿名模型“大象”攪局OpenRouter：100B參數沖到熱榜第一，實測結果如何

智東西 2026-04-16 19:20:03
0 跟貼 0

Claude Opus 4.7深夜上線，評分碾壓

機器之心Pro 2026-04-17 10:08:00
0 跟貼 0
不同國家過斑馬線，規則差別居然這么大！

酒癡說夢 2026-04-15 11:12:35
1855 跟貼 1855
杭州女子買5份海鮮3份僅退款商家氣憤跨省趕來質問

錢江晚報 2026-04-16 14:34:09
21802 跟貼 21802
首個Qwen3.6開源模型來了！編程視覺雙提升，還兼容OpenClaw

智東西 2026-04-17 06:18:14
5 跟貼 5
這是哪一版奧特曼求科普

莫玲瓏剪輯 2026-04-15 14:49:08
1 跟貼 1
上一個兄弟離職了，我接手了他的代碼，我承認沒憋住

環亞搞笑 2026-04-14 14:35:36
3 跟貼 3
奧特曼豪宅 48 小時遇襲兩次，反 AI 怒火燒向全球

果殼 2026-04-14 20:16:56
19 跟貼 19
不是，怎么有模型叫“老婆們”，還能視頻通話啊？

差評XPIN 2026-04-17 00:09:07
1 跟貼 1
小貓這是代碼沖突了還是抽筋了，突然就卡了一下

重慶城市TV 2026-04-14 17:04:41
0 跟貼 0
老板扮演成奧特曼，在菜市場賣肉，為了賣貨也是想盡辦法！

土豪搞笑協會鴨 2026-04-15 13:53:13
1 跟貼 1
900奈拉賭2000萬？這串代碼在玩什么

綠茵狂熱者 2026-04-17 08:30:11
0 跟貼 0
玩“扣子”、創建智能體，這里的夜校課程玩出新花樣→

上海長寧 2026-04-16 17:37:21
0 跟貼 0
ChatGPT之父奧特曼的家炸了！48小時內兩次遭襲，原因竟是

財經網科技 2026-04-15 15:59:12
4 跟貼 4
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
確認了！兩人系間諜

浙江之聲 2026-04-16 22:16:31
6777 跟貼 6777
為證清白瘋狂殺人？邏輯鬼才

喜蕃影視 2026-04-13 15:56:00
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
本川轉債今日申購

每日經濟新聞 2026-04-17 08:30:09
0 跟貼 0
當寶寶和奧特曼和怪獸在一個電梯，趴在媽媽的懷里嚎啕大哭

趣拍小記 2026-04-15 10:42:58
1 跟貼 1
揭秘年銷10億的爆款宋柚汁：“宋柚”是商標，柚含量不到3%，主配料為糖水，品牌號稱全國銷量第一

藍鯨新聞 2026-04-15 09:44:24
3293 跟貼 3293
奧特曼和達里奧的十年恩怨，如何走到全面開戰？

量子位 2026-04-06 05:39:19
0 跟貼 0
炸奧特曼的人被扒出來了

量子位 2026-04-16 09:06:14
1 跟貼 1
你相信光嗎？荊門這位醫生，收到一面 “奧特曼錦旗”

網易湖北 2026-04-15 18:10:17
0 跟貼 0
當視頻難以被表征1

機器之心Pro 2026-03-03 17:21:59
0 跟貼 0
男子因噪音過敏住5年隔音艙：自己設計，已接上百個訂單，幫噪音受困者找回睡眠

半島官網 2026-04-16 11:20:50
2203 跟貼 2203
男子開車正常直行，不料差點撞到闖紅燈的阿姨，提醒：遵守交通規則，安全文明出行

氧氣周末 2026-04-16 16:31:33
0 跟貼 0
河南萬歲山武俠城演出中“大象”露出人腳，景區：沒飼養過大象，是4名工作人員扮的

環球網資訊 2026-04-16 11:29:34
2657 跟貼 2657
維斯塔潘喊話F1：把V10引擎還給我

籃壇第一線 2026-04-17 08:56:26
0 跟貼 0
媒體：法國要"將不義之財歸還中國" 沒你想得那么容易

新民周刊 2026-04-16 15:02:54
2347 跟貼 2347
組裝V8汽車發動機模型

制造科技 2026-04-16 13:26:17
0 跟貼 0
400毫升無償獻血證被中介賣至2000元獻血者僅拿400元

大風新聞 2026-04-16 19:53:03
1265 跟貼 1265
五爽越級實力直擊年輕用戶需求走進極狐全新阿爾法S5

AutoVideo 2026-04-16 17:55:00
32 跟貼 32

愛范兒

消費科技第一媒體

38710文章數 2601491關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

健康

數碼

公開課

軍事航空

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

剛剛，Claude Opus 4.7突然發布：不是最強，但奧特曼又得失眠

Anthropic推出Opus 4.7，坦言依不及Mythos

男子快遞被人力資源女同事私自拆開 幾天后反被開除

男子快遞被人力資源女同事私自拆開 幾天后反被開除

皇馬拜仁踢出名局，但最搶鏡的還是他

絲芭傳媒創始人王子杰去世，享年63歲

海爾與醫美女王互撕 換血抗衰誰的生意？

埃安N60預售11.58萬起 標配激光雷達/零重力座椅

態度原創

從“陪練”到“引路”：我們是如何陪孩子跳出冠軍與學霸雙軌的——王亮家教好故事

干細胞抗衰4大誤區,90%的人都中招

Alienware聯合Team Liquid推出《星球大戰》主題鍵帽、鼠標墊

美宣布黎以停火10天 以方稱不會撤軍

男子快遞被人力資源女同事私自拆開幾天后反被開除

男子快遞被人力資源女同事私自拆開幾天后反被開除

海爾與醫美女王互撕換血抗衰誰的生意？

埃安N60預售11.58萬起標配激光雷達/零重力座椅

美宣布黎以停火10天以方稱不會撤軍