網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

首個(gè)OpenClaw龍蝦大模型排行榜來(lái)了！兩個(gè)國(guó)產(chǎn)?AI?殺進(jìn)全球前三，最省錢(qián)養(yǎng)蝦方案來(lái)了。

2026-03-10 09:15:01　來(lái)源: 純潔的微笑

陜西舉報(bào)

分享至

我的創(chuàng)業(yè)故事：《

大家好，我是微笑哥。

龍蝦（OpenClaw)好用，Token 太貴！

這可不是我一個(gè)人的感覺(jué)，這是全世界人民的普遍體驗(yàn)，這兩天有很多朋友讓我推薦一些免費(fèi)的模型。

其實(shí)很多 API 廠商都有一些免費(fèi)的額度，或者說(shuō)有一些免費(fèi)的 API 可以使用的，我都寫(xiě)到了這個(gè)文檔中，想領(lǐng)取文檔的直接拉到文末。

大家都知道 Claude、ChatGpt 的 API 是最好用的，但是實(shí)在是太貴了，龍蝦又非常消耗 Token。

在群里很多深度玩小龍蝦的朋友，一天消耗幾百刀是太普遍了，這普通人誰(shuí)玩得起，國(guó)外用戶也消耗不起呀。

于是很多性價(jià)比高的，中國(guó)大模型API成為了大家的首選，在全球世界上也是這樣子的，最新的排行榜也能證明。

這兩天，OpenClaw 的創(chuàng)始人，發(fā)布了一個(gè)最適合 OpenClaw 的大模型排行榜。

專門(mén)針對(duì) OpenClaw 的基準(zhǔn)測(cè)試 PinchBench，用于評(píng)估大語(yǔ)言模型在 OpenClaw 任務(wù)中的表現(xiàn)。

PinchBench是專門(mén)針對(duì)OpenClaw生態(tài)設(shè)計(jì)的一套AI Agent 基準(zhǔn)測(cè)試（benchmark），主要用來(lái)評(píng)估不同大模型在真實(shí) Agent 自動(dòng)化任務(wù)中的能力，而不僅僅是聊天能力。

它通過(guò)一系列真實(shí)任務(wù)（如工具調(diào)用、內(nèi)容生成、文件操作、多步驟任務(wù)執(zhí)行、記憶能力），評(píng)估不同大模型在自動(dòng)化任務(wù)和 Agent 執(zhí)行能力上的表現(xiàn)。

簡(jiǎn)單說(shuō)：

PinchBench 就是給 OpenClaw AI Agent “跑分”的測(cè)試，用來(lái)比較不同模型誰(shuí)更適合做 Agent。

從新的跑分成績(jī)來(lái)看MiniMax-m2.1 和 kimi-k2.5 進(jìn)入了前三

第一名：Gemini 3 Flash (Google)

沒(méi)錯(cuò)，又是那個(gè)主打“又快又便宜”的 Flash。它以95.1%的成功率拿下了冠軍。

這說(shuō)明在 Agent（智能體）賽道，模型不需要很大，但腦子必須靈光。

第二、三名：MiniMax M2.1 & Kimi K2.5

這是最讓我熱血沸騰的地方！國(guó)產(chǎn)大模型MiniMax和月之暗面（Kimi）直接包攬了全球前三的剩下兩個(gè)席位。

什么 GPT-4o、Claude 4.5，在這次的“龍蝦”任務(wù)實(shí)測(cè)中，居然都被咱們國(guó)產(chǎn)模型甩在了身后。

說(shuō)實(shí)話這個(gè)成績(jī)比我想象中要好太多了。完整的排名可以從這里看：https://pinchbench.com/

在 OpenClaw 的 Agent 任務(wù)中，模型需要頻繁進(jìn)行“思考-執(zhí)行-反饋”的循環(huán)，所以首字延遲（TTFT）和生成速度（TPS）至關(guān)重要。

在模型速度 minimax-m2.5 排第一；谷歌排名第二；Meta 排名第三。

在花錢(qián)這個(gè)指標(biāo)上面，我估計(jì)大家關(guān)注最多了。

如果你打算讓“小龍蝦”幫你掛機(jī)干活，API 的花費(fèi)可能直接勸退。這次國(guó)產(chǎn)模型表現(xiàn)出了極高的性價(jià)比。

最省錢(qián)：gpt-5-nano和Gemini 3 Flash （谷歌的輕量版也很能打呀），輸入約 $0.1/1M tokens，輸出約 $0.4/1M tokens。

谷歌在打價(jià)格戰(zhàn)，目前的單價(jià)幾乎是所有大廠里最低的。如果你是重度使用者，它是首選。

高性價(jià)比（國(guó)產(chǎn)）：MiniMax M2.1 / 2.5；價(jià)格：輸入約￥0.2/1M tokens（約 $0.03）。

MiniMax 的 M2 系列采用了更小規(guī)模的參數(shù)優(yōu)化，價(jià)格比 GPT-4o 便宜了接近 90%，但任務(wù)成功率卻能進(jìn)全球前三，簡(jiǎn)直是“性價(jià)比狂魔”。

最貴的是：Claude 4.5 Opus價(jià)格：高達(dá) $15/1M tokens 以上，雖然聰明，但成本是 Flash 模型的150 倍。

在“養(yǎng)蝦”圈，一般只把它當(dāng)成“大腦”處理極難的問(wèn)題，日常跑腿（比如搜網(wǎng)頁(yè)、點(diǎn)外賣(mài)）用它簡(jiǎn)直是燒錢(qián)。

總和對(duì)比下來(lái)：

國(guó)外來(lái)看Gemini 3 Flash 是綜合贏家，不管是能力、速度、價(jià)格，都排在第一梯隊(duì)，養(yǎng)蝦首選。

國(guó)內(nèi)來(lái)看 miniMax 成為最大贏家，不管是能力、還是速度、價(jià)格都不差，國(guó)內(nèi)用戶養(yǎng)蝦首選。

綜合對(duì)比，怎么養(yǎng)蝦最劃算？

高頻任務(wù) → minimax 或 z-ai，速度快+成本低
批量非實(shí)時(shí)任務(wù) →Gemini 3 Flash或 gpt-5-nano，成本更低，耐心等待即可

總結(jié)：日常自動(dòng)化用速度快、成本低的國(guó)產(chǎn)模型，關(guān)鍵高精度任務(wù)則用理解能力強(qiáng)但成本高的國(guó)外模型，平時(shí)以國(guó)產(chǎn)模型為主，必要時(shí)調(diào)用高端模型，這樣既保證效率，又控制賬單開(kāi)支。

我創(chuàng)建了一個(gè) OpenClaw 交流群，專門(mén)交流：

1、小龍蝦怎么玩

2、可以做哪些自動(dòng)化

3、有哪些賺錢(qián)思路

4、最新玩法案例

5、進(jìn)群就送OpenClaw 中文學(xué)習(xí)指南（已經(jīng)寫(xiě)了上萬(wàn)字了，還在增加）

群完全免費(fèi)，但有一個(gè)規(guī)矩：禁止發(fā)廣告，發(fā)廣告直接永久拉黑。

如果你對(duì) AI自動(dòng)賺錢(qián) / AI自動(dòng)干活 / AI效率工具感興趣，可以進(jìn)來(lái)一起研究。

① 添加下方微信

② 通過(guò)后回復(fù)：小龍蝦

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.