我的創(chuàng)業(yè)故事:《
大家好,我是微笑哥。
龍蝦(OpenClaw)好用,Token 太貴!
這可不是我一個(gè)人的感覺(jué),這是全世界人民的普遍體驗(yàn),這兩天有很多朋友讓我推薦一些免費(fèi)的模型。
其實(shí)很多 API 廠商都有一些免費(fèi)的額度,或者說(shuō)有一些免費(fèi)的 API 可以使用的,我都寫(xiě)到了這個(gè)文檔中,想領(lǐng)取文檔的直接拉到文末。
![]()
大家都知道 Claude、ChatGpt 的 API 是最好用的,但是實(shí)在是太貴了,龍蝦又非常消耗 Token。
在群里很多深度玩小龍蝦的朋友,一天消耗幾百刀是太普遍了,這普通人誰(shuí)玩得起,國(guó)外用戶也消耗不起呀。
于是很多性價(jià)比高的,中國(guó)大模型API成為了大家的首選,在全球世界上也是這樣子的,最新的排行榜也能證明。
這兩天,OpenClaw 的創(chuàng)始人,發(fā)布了一個(gè)最適合 OpenClaw 的大模型排行榜。
![]()
專門(mén)針對(duì) OpenClaw 的基準(zhǔn)測(cè)試 PinchBench,用于評(píng)估大語(yǔ)言模型在 OpenClaw 任務(wù)中的表現(xiàn)。
![]()
PinchBench是專門(mén)針對(duì)OpenClaw生態(tài)設(shè)計(jì)的一套AI Agent 基準(zhǔn)測(cè)試(benchmark),主 要用來(lái)評(píng)估不同大模型在真實(shí) Agent 自動(dòng)化任務(wù)中的能力,而不僅僅是聊天能力。
它通過(guò)一系列真實(shí)任務(wù)(如工具調(diào)用、內(nèi)容生成、文件操作、多步驟任務(wù)執(zhí)行、記憶能力),評(píng)估不同大模型在自動(dòng)化任務(wù)和 Agent 執(zhí)行能力上的表現(xiàn)。
簡(jiǎn)單說(shuō):
PinchBench 就是給 OpenClaw AI Agent “跑分”的測(cè)試,用來(lái)比較不同模型誰(shuí)更適合做 Agent。
從新的跑分成績(jī)來(lái)看MiniMax-m2.1 和 kimi-k2.5 進(jìn)入了前三
![]()
第一名:Gemini 3 Flash (Google)
沒(méi)錯(cuò),又是那個(gè)主打“又快又便宜”的 Flash。它以95.1%的成功率拿下了冠軍。
這說(shuō)明在 Agent(智能體)賽道,模型不需要很大,但腦子必須靈光。
第二、三名:MiniMax M2.1 & Kimi K2.5
這是最讓我熱血沸騰的地方!國(guó)產(chǎn)大模型MiniMax和月之暗面(Kimi)直接包攬了全球前三的剩下兩個(gè)席位。
什么 GPT-4o、Claude 4.5,在這次的“龍蝦”任務(wù)實(shí)測(cè)中,居然都被咱們國(guó)產(chǎn)模型甩在了身后。
說(shuō)實(shí)話這個(gè)成績(jī)比我想象中要好太多了。完整的排名可以從這里看:https://pinchbench.com/
在 OpenClaw 的 Agent 任務(wù)中,模型需要頻繁進(jìn)行“思考-執(zhí)行-反饋”的循環(huán),所以首字延遲(TTFT)和生成速度(TPS)至關(guān)重要。
在模型速度 minimax-m2.5 排第一;谷歌排名第二;Meta 排名第三。
![]()
在花錢(qián)這個(gè)指標(biāo)上面,我估計(jì)大家關(guān)注最多了。
如果你打算讓“小龍蝦”幫你掛機(jī)干活,API 的花費(fèi)可能直接勸退。這次國(guó)產(chǎn)模型表現(xiàn)出了極高的性價(jià)比。
最省錢(qián):gpt-5-nano和Gemini 3 Flash (谷歌的輕量版也很能打呀),輸入約 $0.1/1M tokens,輸出約 $0.4/1M tokens。
谷歌在打價(jià)格戰(zhàn),目前的單價(jià)幾乎是所有大廠里最低的。如果你是重度使用者,它是首選。
高性價(jià)比(國(guó)產(chǎn)):MiniMax M2.1 / 2.5;價(jià)格: 輸入約 ¥0.2/1M tokens(約 $0.03)。
MiniMax 的 M2 系列采用了更小規(guī)模的參數(shù)優(yōu)化,價(jià)格比 GPT-4o 便宜了接近 90%,但任務(wù)成功率卻能進(jìn)全球前三,簡(jiǎn)直是“性價(jià)比狂魔”。
最貴的是:Claude 4.5 Opus價(jià)格: 高達(dá) $15/1M tokens 以上,雖然聰明,但成本是 Flash 模型的150 倍。
在“養(yǎng)蝦”圈,一般只把它當(dāng)成“大腦”處理極難的問(wèn)題,日常跑腿(比如搜網(wǎng)頁(yè)、點(diǎn)外賣(mài))用它簡(jiǎn)直是燒錢(qián)。
![]()
在“養(yǎng)蝦”圈,一般只把它當(dāng)成“大腦”處理極難的問(wèn)題,日常跑腿(比如搜網(wǎng)頁(yè)、點(diǎn)外賣(mài))用它簡(jiǎn)直是燒錢(qián)。
總和對(duì)比下來(lái):
國(guó)外來(lái)看Gemini 3 Flash 是綜合贏家,不管是能力、速度、價(jià)格,都排在第一梯隊(duì),養(yǎng)蝦首選。
國(guó)內(nèi)來(lái)看 miniMax 成為最大贏家,不管是能力、還是速度、價(jià)格都不差,國(guó)內(nèi)用戶養(yǎng)蝦首選。
綜合對(duì)比,怎么養(yǎng)蝦最劃算?
高頻任務(wù) → minimax 或 z-ai,速度快+成本低
批量非實(shí)時(shí)任務(wù) →Gemini 3 Flash或 gpt-5-nano,成本更低,耐心等待即可
總結(jié):日常自動(dòng)化用速度快、成本低的國(guó)產(chǎn)模型,關(guān)鍵高精度任務(wù)則用理解能力強(qiáng)但成本高的國(guó)外模型,平時(shí)以國(guó)產(chǎn)模型為主,必要時(shí)調(diào)用高端模型,這樣既保證效率,又控制賬單開(kāi)支。
我創(chuàng)建了一個(gè) OpenClaw 交流群,專門(mén)交流:
1、小龍蝦怎么玩
2、可以做哪些自動(dòng)化
3、有哪些賺錢(qián)思路
4、最新玩法案例
5、進(jìn)群就送OpenClaw 中文學(xué)習(xí)指南(已經(jīng)寫(xiě)了上萬(wàn)字了,還在增加)
群 完全免費(fèi),但有一個(gè)規(guī)矩:禁止發(fā)廣告,發(fā)廣告直接永久拉黑。
如果你對(duì) AI自動(dòng)賺錢(qián) / AI自動(dòng)干活 / AI效率工具 感興趣,可以進(jìn)來(lái)一起研究。
① 添加下方微信
② 通過(guò)后回復(fù):小龍蝦
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.