337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

Claude Opus 4.7 來了,編程能力又炸了

Claude Opus4.7

0
分享至

今天繼續聊 Claude —— Anthropic 剛剛正式發布了 Claude Opus 4.7,編程能力這次又是一次暴擊

Benchmark 一覽

下圖是 Anthropic 給出的跨領域 benchmark 對比,Opus 4.7 在大多數任務上超過了 Opus 4.6,以及 GPT-5.4 和 Gemini 3.1 Pro:


Claude Opus 4.7 跨領域 Benchmark 對比 它比 Opus 4.6 強在哪?

Anthropic 官方說,Opus 4.7 在高級軟件工程上是 Opus 4.6 的「顯著提升」,尤其是在那些最難的任務上

這話我本來要打個折,但看了一圈測試用戶的反饋之后,我信了

幾個讓我印象深刻的數據:

  • Cursor :在 93 個編程任務的 benchmark 上,任務解決率比 Opus 4.6 **提升了 13%**,包括 4 個 Opus 4.6 和 Sonnet 4.6 都搞不定的任務

  • Rakuten :在 SWE-bench 上,Opus 4.7 解決的真實生產 bug 是 Opus 4.6 的 3 倍 。

  • XBOW(自主滲透測試) :視覺準確性從 Opus 4.6 的 54.5% 直接干到 **98.5%**,這簡直是量變引發質變

  • Notion :工具調用準確率和規劃能力提升超過 **10%**,更難得的是,它是第一個通過隱式需求測試(implicit-need tests)的模型

視覺能力:分辨率翻了 3 倍多

這次 Opus 4.7 的視覺升級幅度相當大

之前的 Claude 模型能接受的圖片分辨率,現在 Opus 4.7 可以接受最長邊 2,576 像素(約 3.75 百萬像素),是之前版本的 3 倍以上

這意味著什么?

  • 讀密集截圖的 computer-use agent,再也不會因為文字太小看不清而出錯

  • 從復雜圖表里提取數據,精度大幅提升

  • 科學、法律文檔里那些需要像素級精準的工作,終于能干了

來自 Solve Intelligence(生命科學專利工作流)的反饋印證了這一點:從化學結構式到復雜技術圖紙,理解能力大幅躍升

注意這是模型層面的變化,不是 API 參數,圖片會自動以更高精度處理。但因為高分辨率圖片消耗 token 更多,如果你不需要那么高的精度,可以在發送前先降采樣

指令遵循:這次是認真的

Opus 4.7 在指令遵循上大幅提升

聽起來是好事,但 Anthropic 自己也提醒了:之前給舊模型寫的 prompt,有時候會跑出意外結果——因為舊模型對指令是「松散理解」甚至跳過某些部分,現在 Opus 4.7 是字面意思照單全收

所以如果你是 API 用戶,升級前最好重新審視一下你的 prompt,該精確的地方要精確,該刪掉的廢話要刪掉

新功能:xhigh 努力等級

Opus 4.7 引入了全新的 xhigh(extra high)努力等級,介于原來的 highmax 之間

這給用戶提供了更細粒度的控制:在硬問題上,你可以選擇在「思考質量」和「響應延遲」之間找到更合適的平衡點

在 Claude Code 里,現在默認把所有計劃的努力等級提升到了 xhigh

官方建議在編程和 Agent 場景下測試時,從 highxhigh 開始

下圖是不同努力等級下,token 使用量和任務得分的關系:


不同努力等級下的 token 使用量與任務得分對比 網絡安全:先邁一步,但很謹慎

Anthropic 上周公布了 Project Glasswing,直面 AI 在網絡安全領域的兩面性——風險與機遇。

Opus 4.7 是 Glasswing 框架下第一個正式落地的模型,它的網絡安全能力不如 Claude Mythos Preview(目前最強的 Anthropic 模型),Anthropic 在訓練階段專門做了差異化處理,有意限制了部分網絡安全能力

同時,Opus 4.7 配備了自動檢測和攔截高危網絡安全請求的防護機制

真正有合法需求的安全研究人員、滲透測試工程師,可以通過 Cyber Verification Program 加入白名單

這條路子我覺得挺對的:先在能力較弱的模型上驗證防護機制是否有效,積累經驗后,再逐步向更強的 Mythos 級別模型開放

安全性測評
Claude Opus 4.7 行為審計評分

在安全對齊方面,Opus 4.7 和 Opus 4.6 整體差不多——欺騙行為、諂媚、濫用配合率都處于低水平

部分維度(比如誠實性、對抗 prompt 注入攻擊)比 4.6 有改進,少數地方(比如有害物質信息的過度詳細回復)略微退步

整體結論:「大體對齊、基本可信,但還沒達到理想狀態」

Mythos Preview 依然是 Anthropic 目前對齊效果最好的模型

價格 & 可用性

好消息:價格不變,和 Opus 4.6 一樣:

  • 輸入:**$5 / 百萬 tokens**

  • 輸出:**$25 / 百萬 tokens**

支持平臺:

  • Claude 全產品線

  • Claude API(模型 ID: claude-opus-4-7

  • Amazon Bedrock

  • Google Cloud Vertex AI

  • Microsoft Foundry

還有這些新東西一起上

隨 Opus 4.7 一起發布的還有幾個配套更新:

  1. /ultrareview 命令 (Claude Code):一鍵啟動深度代碼審查,像一個認真的 reviewer 一樣幫你找 bug 和設計問題,Pro 和 Max 用戶各有 3 次免費試用額度。

  2. Task Budgets(公測) (API):給開發者一個新機制,引導 Claude 在長任務中合理分配 token 預算,避免前緊后松或前松后緊

  3. Auto Mode 擴展 :Max 用戶現在也可以開啟 Auto Mode,讓 Claude 在長任務里自主決策權限請求,減少中斷

升級注意事項

如果你在生產上用 Opus 4.6,升級到 4.7 有兩個點要注意:

  1. 新 tokenizer :同樣的輸入,token 數大約會增加 1.0–1.35 倍 ,取決于內容類型

  2. 更高努力等級下思考更多 :尤其是 Agent 場景的后續對話輪次,輸出 token 會增加

Anthropic 提供了遷移指南,建議先在真實流量上測一下差異

總結

Opus 4.7 的核心關鍵詞:編程更強、視覺更清、指令更準、安全更嚴

如果你是:

  • Claude Code 用戶 :直接用,默認已升級到 xhigh 努力等級,新的 /ultrareview 也很值得試

  • API 開發者 :記得重新調 prompt,關注 token 用量變化,遷移指南先讀一遍

  • 網絡安全從業者 :有合法需求的走 Cyber Verification Program

最讓我感興趣的其實是這個關于「更好同事」的描述——一個會在技術討論中反駁你、幫你做出更好決定的 AI

這可能才是 AI 應該有的樣子,不是附和你,是真的幫你。

.7

制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
10億都救不了一命!京東副總裁蔡磊,生命進入倒計時

10億都救不了一命!京東副總裁蔡磊,生命進入倒計時

聽風喃
2026-04-06 11:16:04
不知不覺都老了,這兩位演員已經不在了,你還記得他們嗎?

不知不覺都老了,這兩位演員已經不在了,你還記得他們嗎?

阿廢冷眼觀察所
2026-04-11 17:02:28
意媒:利雅得新月俱樂部易主后,小因扎吉帥位愈發不穩

意媒:利雅得新月俱樂部易主后,小因扎吉帥位愈發不穩

懂球帝
2026-04-17 14:00:04
69年耿飚諫言削減對阿爾巴尼亞的援助,毛主席:就耿飆敢說實話

69年耿飚諫言削減對阿爾巴尼亞的援助,毛主席:就耿飆敢說實話

牛馬搞笑
2026-04-17 16:59:24
這次北京國安不能賴傷病 海港比他們傷得猛 但拿得分比他們多

這次北京國安不能賴傷病 海港比他們傷得猛 但拿得分比他們多

80后體育大蜀黍
2026-04-17 22:12:56
一個人如果讓你產生了以下三種感覺,是老天在提醒你要遠離他

一個人如果讓你產生了以下三種感覺,是老天在提醒你要遠離他

洞讀君
2026-04-15 21:05:03
奇怪!飛機改成硬座、高鐵也在降速,交通工具為何集體降級?

奇怪!飛機改成硬座、高鐵也在降速,交通工具為何集體降級?

丁丁鯉史紀
2026-04-16 14:07:38
接下來世界要迎接的戰爭,很可能就是大家都在關注的中日沖突

接下來世界要迎接的戰爭,很可能就是大家都在關注的中日沖突

南權先生
2026-04-05 05:20:03
崇明人鐘愛的“籽魚”迎來最佳賞味期

崇明人鐘愛的“籽魚”迎來最佳賞味期

上觀新聞
2026-04-17 17:28:15
兒子在越戰犧牲,老母親無路費去掃墓,等了20年終于摸到兒子墓碑

兒子在越戰犧牲,老母親無路費去掃墓,等了20年終于摸到兒子墓碑

歷史龍元閣
2026-04-15 11:20:17
美軍準備“清除”伊朗水雷,但卻是一場致命的“捉迷藏”游戲

美軍準備“清除”伊朗水雷,但卻是一場致命的“捉迷藏”游戲

澎湃新聞
2026-04-17 08:06:28
調查發現:每天吃一根香蕉,就等于給血脂添負擔?真相來了

調查發現:每天吃一根香蕉,就等于給血脂添負擔?真相來了

今日養生之道
2026-04-17 12:48:36
2-0擊敗深圳新鵬城,重慶銅梁龍豪取3連勝,向余望打入中超處子球

2-0擊敗深圳新鵬城,重慶銅梁龍豪取3連勝,向余望打入中超處子球

側身凌空斬
2026-04-17 21:30:26
為啥一個盛世,會比一場戰爭殺死更多的人?

為啥一個盛世,會比一場戰爭殺死更多的人?

杜千
2026-04-16 21:04:10
日艦穿越臺海,中國國防部外交部罕見同時抗議:這點非常不一樣

日艦穿越臺海,中國國防部外交部罕見同時抗議:這點非常不一樣

荷蘭豆愛健康
2026-04-18 01:29:28
我今年55了,想用血淚教訓告訴你:不要跟任何人,包括你的父母、子女、枕邊人,分享這4件事

我今年55了,想用血淚教訓告訴你:不要跟任何人,包括你的父母、子女、枕邊人,分享這4件事

東林夕亭
2026-03-27 09:07:57
師徒決裂!奧運冠軍發文炮轟76歲恩師:披著羊皮的狼,逼我吃藥!

師徒決裂!奧運冠軍發文炮轟76歲恩師:披著羊皮的狼,逼我吃藥!

拳擊時空
2026-03-29 05:01:30
烏克蘭通過法律程序,將“俄烏戰爭”,命名為“烏克蘭獨立戰爭”

烏克蘭通過法律程序,將“俄烏戰爭”,命名為“烏克蘭獨立戰爭”

我心縱橫天地間
2026-01-22 18:41:25
金立手機創始人消失8年現身,他曾因賭博導致公司破產!網友熱議

金立手機創始人消失8年現身,他曾因賭博導致公司破產!網友熱議

胡侃社會百態
2026-04-16 11:18:12
全網炸了!于和偉5秒連扇三記耳光,打出了中國人憋了80年的惡氣

全網炸了!于和偉5秒連扇三記耳光,打出了中國人憋了80年的惡氣

臨云史策
2026-04-16 11:12:54
2026-04-18 03:48:49
Ai學習的老章 incentive-icons
Ai學習的老章
Ai學習的老章
3328文章數 11133關注度
往期回顧 全部

科技要聞

7家頭部平臺被罰沒35.97億元

頭條要聞

知情人:伊朗為霍爾木茲海峽通行設定三個條件

頭條要聞

知情人:伊朗為霍爾木茲海峽通行設定三個條件

體育要聞

中超-泰山1-1海港 楊希處子球克雷桑任意球扳平

娛樂要聞

劉德華摯友潘宏彬離世 曾一起租房住

財經要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

又快又穩的開掛動力! 阿維塔06T全系搭分布式電驅

態度原創

游戲
手機
藝術
旅游
家居

PS5完全獨占新作曝光!科樂美為索尼傾力打造

手機要聞

vivo萬級電池新機曝光:10200mAh電池+90W快充,友商接得住嗎!

藝術要聞

你絕對想不到!文森特的色粉作品竟如此驚艷!

旅游要聞

三月三登泰山!蟠桃會+古風巡游驚艷出圈

家居要聞

法式線條 時光靜淌

無障礙瀏覽 進入關懷版