![]()
作者 | 董道力
郵箱 | dongdaoli@pingwest.com
這兩天,所謂“Anthropic封禁OpenClaw”的報(bào)道鋪天蓋地,但事實(shí)上Anthropic 是停止了OpenClaw這種第三方產(chǎn)品直接通過Claude Pro等固定付費(fèi)的訂閱方式來調(diào)用能力的路徑。
你真的想用Anthropic 的模型和產(chǎn)品,要么通過官方來使用這種訂閱模式,要么可以使用按量充費(fèi)的API額度,封禁是沒有封禁,只是限制了調(diào)用和對(duì)應(yīng)的“收費(fèi)”方式。
相比于錯(cuò)誤理解成“封禁”并第一時(shí)間聯(lián)想到“過河拆橋”的一堆討論,小米 MiMo 大模型負(fù)責(zé)人羅福莉的一篇長(zhǎng)文是少有的對(duì)這個(gè)事情真正認(rèn)真分析,并聊到點(diǎn)子上的。
她認(rèn)為,Anthropic 的動(dòng)作并不意外,此前我們一直在一場(chǎng)無(wú)法持續(xù)的虛假token消耗狂歡里,現(xiàn)在該醒醒了。
![]()
1
訂閱制不適合第三方 Agent
羅福莉首先對(duì) Claude Code 的訂閱設(shè)計(jì)給出正面評(píng)價(jià),認(rèn)為這是業(yè)內(nèi)少有的、認(rèn)真對(duì)待算力分配問題的產(chǎn)品設(shè)計(jì)。其邏輯是:輕度用戶用的少,補(bǔ)貼重度用戶,總體均衡。
但她隨即指出,這套邏輯有一個(gè)隱藏前提:用戶用的必須是 Anthropic 自己的框架。一旦脫離 Claude Code,就會(huì)出問題。
她以 OpenClaw 作為案例,指出第三方 harness 同時(shí)破壞了兩個(gè)層面的均衡。
第一層是請(qǐng)求次數(shù)。她在推文中寫道:"我沒辦法嚴(yán)格計(jì)算第三方 harness 接入造成的損失,但我近距離看過 OpenClaw 的上下文管理,很糟糕。在單次用戶查詢里,它會(huì)觸發(fā)多輪低價(jià)值工具調(diào)用,每輪作為獨(dú)立 API 請(qǐng)求發(fā)出,每個(gè)請(qǐng)求攜帶的上下文窗口往往超過 100K tokens。實(shí)際請(qǐng)求次數(shù)是 Claude Code 原生框架的數(shù)倍。折算成 API 定價(jià),真實(shí)成本大概是訂閱價(jià)格的數(shù)十倍。"
簡(jiǎn)單說,同一件事,OpenClaw 要跑十趟,原生框架跑一趟。
![]()
第二個(gè)層面是緩存效率。她在評(píng)論區(qū)補(bǔ)充道:"更大的問題是,很多第三方 harness 在接近上下文長(zhǎng)度限制時(shí),每隔幾步就壓縮一次工具返回結(jié)果,導(dǎo)致 cache 命中率極低。"
Claude 的緩存機(jī)制依賴上下文前綴的一致性,前綴匹配,才能復(fù)用緩存、跳過重復(fù)計(jì)算。但每次壓縮都會(huì)改寫上下文內(nèi)容,導(dǎo)致前綴失配,緩存作廢,模型被迫重新全量讀入。
兩個(gè)問題疊在一起,把每一次查詢的實(shí)際 token 消耗都推向極值。
OpenClaw 的用戶幾乎清一色是重度用戶,而即便是輕度用戶,通過 OpenClaw 發(fā)出的每一次請(qǐng)求,在成本結(jié)構(gòu)上也等同于重度用戶。
訂閱制賴以成立的分布假設(shè)就此坍塌,補(bǔ)貼關(guān)系不復(fù)存在,Anthropic 單方面承擔(dān)成本缺口。
就像健身房辦卡,就是賭一些用戶辦了卡但不來,從而補(bǔ)貼天天去健身房用戶的成本,而 OpenClaw 讓每個(gè)用戶 7x24 小時(shí)的都去高強(qiáng)度訓(xùn)練,健身房成本就下不來了。
1
短期陣痛,長(zhǎng)期改善工程紀(jì)律
而對(duì)于用戶的憤怒,羅福莉認(rèn)為這個(gè)短痛是有用的。
她寫道:"第三方 harness 還是可以調(diào)用 Claude,只是不能再搭訂閱的便車了。短期內(nèi),這批用戶會(huì)感受到成本沖擊,輕松跳升數(shù)十倍。但這個(gè)壓力,恰恰會(huì)推動(dòng)這些 harness 去改進(jìn)上下文管理、最大化 prompt cache 命中率、減少無(wú)效 token 消耗。痛苦最終會(huì)轉(zhuǎn)化為工程紀(jì)律。"
訂閱制的問題在于,它讓 harness 開發(fā)者從來不需要為單次請(qǐng)求的 token 消耗負(fù)責(zé)。上下文管理差不要緊,cache 命中率低不要緊,反正成本由 Anthropic 的服務(wù)器悄悄吸收。
但一旦回到 API 計(jì)費(fèi),這個(gè)結(jié)構(gòu)就變了。token 浪費(fèi)會(huì)直接體現(xiàn)在賬單上,"優(yōu)化效率"從可做可不做,變成了有商業(yè)壓力驅(qū)動(dòng)的工程需求。
每個(gè)開發(fā)者單獨(dú)決策時(shí)都傾向于多用,整體生態(tài)的調(diào)用質(zhì)量因此持續(xù)惡化。計(jì)費(fèi)結(jié)構(gòu)的改變,是把外部性內(nèi)部化的強(qiáng)制手段。
![]()
1
Tokens 價(jià)格戰(zhàn)只會(huì)導(dǎo)致惡性循環(huán)
相比于感慨Anthropic 過河拆橋,抄襲OpenClaw后要用自己第一方工具收割用戶的討論,羅福莉提出了一個(gè)更加有點(diǎn)“皇帝新衣”味道的提醒:
今天單純?yōu)榱藅oken消耗而狂歡,以及模型廠商們由此出發(fā)打的各種價(jià)格戰(zhàn),將難以為繼。是時(shí)候醒醒了。
她寫道:"我勸 LLM 公司不要在還沒搞清楚 coding plan 怎么定價(jià)之前,就跟著降價(jià)內(nèi)卷。低價(jià)賣 token、同時(shí)向第三方全面開放,對(duì)用戶看起來很友好,但那是一個(gè)陷阱。Anthropic 剛從這個(gè)陷阱里走出來。如果用戶在劣質(zhì) harness、不穩(wěn)定推理服務(wù)、降配模型上反復(fù)碰壁,最終什么都沒做成,用戶體驗(yàn)和留存都不會(huì)好看。"
這個(gè)陷阱的機(jī)制是:大模型公司推出 coding plan 向第三方 harness 開放,和 Claude 一樣會(huì)入不敷出。為了控制成本,平臺(tái)只能降低算力或換用更便宜的低智模型。用戶表面上有充足的額度,但什么都做不好,留存自然也不用說。
問題的根源在于計(jì)費(fèi)結(jié)構(gòu)。Coding Plan 本質(zhì)上是按訂閱周期加請(qǐng)求次數(shù)的粗放額度包,開發(fā)者買的是一段時(shí)間內(nèi)的粗略使用權(quán),感受不到單次請(qǐng)求的真實(shí)成本。
當(dāng)?shù)谌?harness 接入時(shí),上下文管理粗放、冗余請(qǐng)求、低 cache 命中率造成的算力浪費(fèi),成本完全由平臺(tái)默默吸收。
訂閱制切斷了用量與成本之間的信號(hào)傳導(dǎo),重度用戶通過低效 harness 透支的算力,最終迫使平臺(tái)要么封禁第三方,要么靠降速、限流、降配模型來止損,這正是 Anthropic 走到今天這一步的路徑。
![]()
當(dāng)然,羅福莉的另一個(gè)目的也是為她在小米做的嘗試和方案“做廣告”。
MiMo 的 Token Plan 走的是另一條路。MiMo 沒有封掉第三方入口,而是改變了計(jì)費(fèi)結(jié)構(gòu):按實(shí)際 token 消耗量配額,開發(fā)者購(gòu)買以 Credit 為單位的 token 額度。
無(wú)論使用原生框架還是 OpenClaw 等第三方 harness,每一個(gè)浪費(fèi)的 token 都直接從用戶的額度包里扣。平臺(tái)不再為低效 harness 買單,用得多付得多,用得糙成本高,"用量-成本"的關(guān)系重新透明起來。
她將這套邏輯定位為:不是不讓用,而是讓計(jì)費(fèi)結(jié)構(gòu)本身成為約束機(jī)制,推動(dòng)生態(tài)向高效率方向演化。
低價(jià)訂閱的問題不在于便宜本身,而在于它切斷了信號(hào)傳導(dǎo)。在定價(jià)邏輯沒想清楚之前跟進(jìn),復(fù)制的可能不是 Anthropic 的優(yōu)勢(shì),而是它剛剛踩過的坑。
1
競(jìng)爭(zhēng)正式進(jìn)入下一個(gè)階段
羅福莉在推文最后把視野拉到了更大的框架上。
她寫道:"全球算力的供給速度,已經(jīng)追不上 Agent 場(chǎng)景下 token 消耗的增速。真正的出路不是更便宜的 token,而是協(xié)同進(jìn)化,更高 token 效率的 agent harness,乘以更強(qiáng)大、更高效的模型。Anthropic 這次,不管主觀意圖是什么,客觀上把整個(gè)生態(tài),無(wú)論開源還是閉源,都推向了這個(gè)方向。Agent 時(shí)代不屬于燒算力最多的人,而屬于用算力最聰明的人。"
![]()
羅福莉在推文最后正是在挑戰(zhàn)過去幾年 AI 行業(yè)信奉的"算力競(jìng)賽"敘事。
主流邏輯一直是:算力更多,模型更強(qiáng),成本更低,用戶更多,形成正向飛輪。
但 Agent 場(chǎng)景打破了這個(gè)等式。當(dāng)一次用戶查詢可以觸發(fā)數(shù)十次 API 調(diào)用,每次攜帶超過 100K tokens 的上下文,算力消耗的增速就不再是線性的。單純壓低 token 價(jià)格,只會(huì)加速這個(gè)消耗,而不會(huì)改變其結(jié)構(gòu)。
這意味著,下一輪競(jìng)爭(zhēng)的核心指標(biāo),可能不再是"每 token 多便宜",而是"每 token 能完成多少有效工作"。誰(shuí)先在這個(gè)維度上建立優(yōu)勢(shì),誰(shuí)就能在全球算力供給跟不上 Agent 需求增速的窗口期里,占據(jù)真正有利的位置。
Anthropic 這次調(diào)整,無(wú)論出于什么動(dòng)機(jī),都在客觀上把整個(gè)生態(tài)推向了這個(gè)方向。
快把燒token變成某種愛好和社交展示資本的人們吐槽吐槽Anthropic 就罷了,對(duì)于各類Harness產(chǎn)品以及模型廠商們來說,這事真正的信號(hào)意義其實(shí)很強(qiáng),如果還是想著趁亂靠免費(fèi)量大管飽去接住一波流量用戶,就太不合時(shí)宜了。
一個(gè)階段性的狂歡是時(shí)候讓位于在工程和基礎(chǔ)設(shè)施設(shè)計(jì)上的真正重要的工作了。
![]()
點(diǎn)個(gè)“愛心”,再走 吧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.