Anthropic 急了,發(fā)布了 Claude Opus 4.5,同時(shí)終于從原來死貴的 75 美元變成了 25 美元,當(dāng)然還是比 Gemini 3 Pro 貴不少。
介紹一下詳細(xì)更新內(nèi)容:
## 性能表現(xiàn):編程任務(wù)新世界第一
SWE-bench Verified Opus 4.5 拿了第一。
Anthropic 內(nèi)部還做了個(gè)有意思的測試:他們讓 Opus 4.5 做性能工程師的入職考試(2小時(shí)限時(shí)),結(jié)果模型的分?jǐn)?shù)超過了所有人類候選人。
不只是編程,Opus 4.5 在數(shù)學(xué)、視覺、推理等各個(gè)維度都有提升。
## 頂級(jí)模型價(jià)格對比(per million tokens):
- Claude Opus 4.5: $5 / $25
- GPT-5.1: $1.25 / $10
- GPT-5-pro: $15 / $120
- Gemini 3 Pro: $2-4 / $12-18
## 效率大幅提升:更聰明意味著更省錢
Opus 4.5 引入了一個(gè)新參數(shù)叫 effort(努力程度),你可以根據(jù)任務(wù)選擇不同的思考深度。
在 medium effort 模式下,Opus 4.5 達(dá)到了 Sonnet 4.5 的最佳分?jǐn)?shù),但只用了 24% 的輸出 tokens。換句話說,少用了 76% 的 tokens。
即使在 highest effort 模式下,Opus 4.5 的表現(xiàn)超過 Sonnet 4.5 有 4.3 個(gè)百分點(diǎn),同時(shí)還少用了 48% 的 tokens。
這說明模型變聰明了:更少的回溯、更少的冗余探索、更精準(zhǔn)的推理。對于長期運(yùn)行的代理任務(wù),這個(gè)效率提升會(huì)直接轉(zhuǎn)化為成本節(jié)省。
有權(quán)使用 Opus 4.5 的 Claude 和 Claude Code 用戶,已移除針對 Opus 的特定限制。
Max 和 Team Premium 用戶,提高了總體使用上限,這意味著將擁有與之前使用 Sonnet 時(shí)大致相同數(shù)量的 Opus Token。
效率提升這點(diǎn)是這次比較關(guān)鍵的,用的好的話,它可能會(huì)比 sonnet 4.5 還要便宜。
我的觀察是它有點(diǎn)變得像GPT5.1了。 就是輸出的結(jié)果和思考的結(jié)果非常的節(jié)省。然后輸出的結(jié)果就我能看懂,但是它不像是給人看的,寫出來。
![]()
![]()
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.