網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

羅福莉：各位醒醒吧，該結(jié)束token虛假狂歡了

2026-04-07 10:14:49　來源: 硅星人

北京舉報(bào)

分享至

作者｜董道力
郵箱｜ dongdaoli@pingwest.com

這兩天，所謂“Anthropic封禁OpenClaw”的報(bào)道鋪天蓋地，但事實(shí)上Anthropic 是停止了OpenClaw這種第三方產(chǎn)品直接通過Claude Pro等固定付費(fèi)的訂閱方式來調(diào)用能力的路徑。

你真的想用Anthropic 的模型和產(chǎn)品，要么通過官方來使用這種訂閱模式，要么可以使用按量充費(fèi)的API額度，封禁是沒有封禁，只是限制了調(diào)用和對(duì)應(yīng)的“收費(fèi)”方式。

相比于錯(cuò)誤理解成“封禁”并第一時(shí)間聯(lián)想到“過河拆橋”的一堆討論，小米 MiMo 大模型負(fù)責(zé)人羅福莉的一篇長(zhǎng)文是少有的對(duì)這個(gè)事情真正認(rèn)真分析，并聊到點(diǎn)子上的。

她認(rèn)為，Anthropic 的動(dòng)作并不意外，此前我們一直在一場(chǎng)無(wú)法持續(xù)的虛假token消耗狂歡里，現(xiàn)在該醒醒了。

訂閱制不適合第三方 Agent

羅福莉首先對(duì) Claude Code 的訂閱設(shè)計(jì)給出正面評(píng)價(jià)，認(rèn)為這是業(yè)內(nèi)少有的、認(rèn)真對(duì)待算力分配問題的產(chǎn)品設(shè)計(jì)。其邏輯是：輕度用戶用的少，補(bǔ)貼重度用戶，總體均衡。

但她隨即指出，這套邏輯有一個(gè)隱藏前提：用戶用的必須是 Anthropic 自己的框架。一旦脫離 Claude Code，就會(huì)出問題。

她以 OpenClaw 作為案例，指出第三方 harness 同時(shí)破壞了兩個(gè)層面的均衡。

第一層是請(qǐng)求次數(shù)。她在推文中寫道："我沒辦法嚴(yán)格計(jì)算第三方 harness 接入造成的損失，但我近距離看過 OpenClaw 的上下文管理，很糟糕。在單次用戶查詢里，它會(huì)觸發(fā)多輪低價(jià)值工具調(diào)用，每輪作為獨(dú)立 API 請(qǐng)求發(fā)出，每個(gè)請(qǐng)求攜帶的上下文窗口往往超過 100K tokens。實(shí)際請(qǐng)求次數(shù)是 Claude Code 原生框架的數(shù)倍。折算成 API 定價(jià)，真實(shí)成本大概是訂閱價(jià)格的數(shù)十倍。"

簡(jiǎn)單說，同一件事，OpenClaw 要跑十趟，原生框架跑一趟。

第二個(gè)層面是緩存效率。她在評(píng)論區(qū)補(bǔ)充道："更大的問題是，很多第三方 harness 在接近上下文長(zhǎng)度限制時(shí)，每隔幾步就壓縮一次工具返回結(jié)果，導(dǎo)致 cache 命中率極低。"

Claude 的緩存機(jī)制依賴上下文前綴的一致性，前綴匹配，才能復(fù)用緩存、跳過重復(fù)計(jì)算。但每次壓縮都會(huì)改寫上下文內(nèi)容，導(dǎo)致前綴失配，緩存作廢，模型被迫重新全量讀入。

兩個(gè)問題疊在一起，把每一次查詢的實(shí)際 token 消耗都推向極值。

OpenClaw 的用戶幾乎清一色是重度用戶，而即便是輕度用戶，通過 OpenClaw 發(fā)出的每一次請(qǐng)求，在成本結(jié)構(gòu)上也等同于重度用戶。

訂閱制賴以成立的分布假設(shè)就此坍塌，補(bǔ)貼關(guān)系不復(fù)存在，Anthropic 單方面承擔(dān)成本缺口。

就像健身房辦卡，就是賭一些用戶辦了卡但不來，從而補(bǔ)貼天天去健身房用戶的成本，而 OpenClaw 讓每個(gè)用戶 7x24 小時(shí)的都去高強(qiáng)度訓(xùn)練，健身房成本就下不來了。

短期陣痛，長(zhǎng)期改善工程紀(jì)律

而對(duì)于用戶的憤怒，羅福莉認(rèn)為這個(gè)短痛是有用的。

她寫道："第三方 harness 還是可以調(diào)用 Claude，只是不能再搭訂閱的便車了。短期內(nèi)，這批用戶會(huì)感受到成本沖擊，輕松跳升數(shù)十倍。但這個(gè)壓力，恰恰會(huì)推動(dòng)這些 harness 去改進(jìn)上下文管理、最大化 prompt cache 命中率、減少無(wú)效 token 消耗。痛苦最終會(huì)轉(zhuǎn)化為工程紀(jì)律。"

訂閱制的問題在于，它讓 harness 開發(fā)者從來不需要為單次請(qǐng)求的 token 消耗負(fù)責(zé)。上下文管理差不要緊，cache 命中率低不要緊，反正成本由 Anthropic 的服務(wù)器悄悄吸收。

但一旦回到 API 計(jì)費(fèi)，這個(gè)結(jié)構(gòu)就變了。token 浪費(fèi)會(huì)直接體現(xiàn)在賬單上，"優(yōu)化效率"從可做可不做，變成了有商業(yè)壓力驅(qū)動(dòng)的工程需求。

每個(gè)開發(fā)者單獨(dú)決策時(shí)都傾向于多用，整體生態(tài)的調(diào)用質(zhì)量因此持續(xù)惡化。計(jì)費(fèi)結(jié)構(gòu)的改變，是把外部性內(nèi)部化的強(qiáng)制手段。

Tokens 價(jià)格戰(zhàn)只會(huì)導(dǎo)致惡性循環(huán)

相比于感慨Anthropic 過河拆橋，抄襲OpenClaw后要用自己第一方工具收割用戶的討論，羅福莉提出了一個(gè)更加有點(diǎn)“皇帝新衣”味道的提醒：

今天單純?yōu)榱藅oken消耗而狂歡，以及模型廠商們由此出發(fā)打的各種價(jià)格戰(zhàn)，將難以為繼。是時(shí)候醒醒了。

她寫道："我勸 LLM 公司不要在還沒搞清楚 coding plan 怎么定價(jià)之前，就跟著降價(jià)內(nèi)卷。低價(jià)賣 token、同時(shí)向第三方全面開放，對(duì)用戶看起來很友好，但那是一個(gè)陷阱。Anthropic 剛從這個(gè)陷阱里走出來。如果用戶在劣質(zhì) harness、不穩(wěn)定推理服務(wù)、降配模型上反復(fù)碰壁，最終什么都沒做成，用戶體驗(yàn)和留存都不會(huì)好看。"

這個(gè)陷阱的機(jī)制是：大模型公司推出 coding plan 向第三方 harness 開放，和 Claude 一樣會(huì)入不敷出。為了控制成本，平臺(tái)只能降低算力或換用更便宜的低智模型。用戶表面上有充足的額度，但什么都做不好，留存自然也不用說。

問題的根源在于計(jì)費(fèi)結(jié)構(gòu)。Coding Plan 本質(zhì)上是按訂閱周期加請(qǐng)求次數(shù)的粗放額度包，開發(fā)者買的是一段時(shí)間內(nèi)的粗略使用權(quán)，感受不到單次請(qǐng)求的真實(shí)成本。

當(dāng)?shù)谌?harness 接入時(shí)，上下文管理粗放、冗余請(qǐng)求、低 cache 命中率造成的算力浪費(fèi)，成本完全由平臺(tái)默默吸收。

訂閱制切斷了用量與成本之間的信號(hào)傳導(dǎo)，重度用戶通過低效 harness 透支的算力，最終迫使平臺(tái)要么封禁第三方，要么靠降速、限流、降配模型來止損，這正是 Anthropic 走到今天這一步的路徑。

當(dāng)然，羅福莉的另一個(gè)目的也是為她在小米做的嘗試和方案“做廣告”。

MiMo 的 Token Plan 走的是另一條路。MiMo 沒有封掉第三方入口，而是改變了計(jì)費(fèi)結(jié)構(gòu)：按實(shí)際 token 消耗量配額，開發(fā)者購(gòu)買以 Credit 為單位的 token 額度。

無(wú)論使用原生框架還是 OpenClaw 等第三方 harness，每一個(gè)浪費(fèi)的 token 都直接從用戶的額度包里扣。平臺(tái)不再為低效 harness 買單，用得多付得多，用得糙成本高，"用量-成本"的關(guān)系重新透明起來。

她將這套邏輯定位為：不是不讓用，而是讓計(jì)費(fèi)結(jié)構(gòu)本身成為約束機(jī)制，推動(dòng)生態(tài)向高效率方向演化。

低價(jià)訂閱的問題不在于便宜本身，而在于它切斷了信號(hào)傳導(dǎo)。在定價(jià)邏輯沒想清楚之前跟進(jìn)，復(fù)制的可能不是 Anthropic 的優(yōu)勢(shì)，而是它剛剛踩過的坑。

競(jìng)爭(zhēng)正式進(jìn)入下一個(gè)階段

羅福莉在推文最后把視野拉到了更大的框架上。

她寫道："全球算力的供給速度，已經(jīng)追不上 Agent 場(chǎng)景下 token 消耗的增速。真正的出路不是更便宜的 token，而是協(xié)同進(jìn)化，更高 token 效率的 agent harness，乘以更強(qiáng)大、更高效的模型。Anthropic 這次，不管主觀意圖是什么，客觀上把整個(gè)生態(tài)，無(wú)論開源還是閉源，都推向了這個(gè)方向。Agent 時(shí)代不屬于燒算力最多的人，而屬于用算力最聰明的人。"

羅福莉在推文最后正是在挑戰(zhàn)過去幾年 AI 行業(yè)信奉的"算力競(jìng)賽"敘事。

主流邏輯一直是：算力更多，模型更強(qiáng)，成本更低，用戶更多，形成正向飛輪。

但 Agent 場(chǎng)景打破了這個(gè)等式。當(dāng)一次用戶查詢可以觸發(fā)數(shù)十次 API 調(diào)用，每次攜帶超過 100K tokens 的上下文，算力消耗的增速就不再是線性的。單純壓低 token 價(jià)格，只會(huì)加速這個(gè)消耗，而不會(huì)改變其結(jié)構(gòu)。

這意味著，下一輪競(jìng)爭(zhēng)的核心指標(biāo)，可能不再是"每 token 多便宜"，而是"每 token 能完成多少有效工作"。誰(shuí)先在這個(gè)維度上建立優(yōu)勢(shì)，誰(shuí)就能在全球算力供給跟不上 Agent 需求增速的窗口期里，占據(jù)真正有利的位置。

Anthropic 這次調(diào)整，無(wú)論出于什么動(dòng)機(jī)，都在客觀上把整個(gè)生態(tài)推向了這個(gè)方向。

快把燒token變成某種愛好和社交展示資本的人們吐槽吐槽Anthropic 就罷了，對(duì)于各類Harness產(chǎn)品以及模型廠商們來說，這事真正的信號(hào)意義其實(shí)很強(qiáng)，如果還是想著趁亂靠免費(fèi)量大管飽去接住一波流量用戶，就太不合時(shí)宜了。

一個(gè)階段性的狂歡是時(shí)候讓位于在工程和基礎(chǔ)設(shè)施設(shè)計(jì)上的真正重要的工作了。

點(diǎn)個(gè)“愛心”，再走吧

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.