![]()
文:王智遠 | ID:Z201440
MiniMax M2.5 的新聞大家可能已經刷到了。
開源、性能對齊 Claude Opus 4.6、SWE-Bench 80.2%、推理速度是Opus的3倍……
數據都很漂亮。但我注意到一個數字,它比所有跑分都更值得琢磨:1美金/小時
什么意思?
你花1美金,能讓一個SOTA級別的AI Agent連續工作一小時,寫代碼、做Excel、查資料、寫PPT,24小時不眠不休。
歷史上,每一次技術革命的真正爆發點,還有價格跌破心理閾值的那一刻;所以,我想聊一個議題:當AI勞動力的時薪降到1美金,世界會發生什么?
01
咱們先把這個數字放在真實世界。美國勞工統計局的數據,知識工作者的中位時薪,大概是35到40美金。這是一個什么水平?
舊金山一個剛畢業的本科生,進科技公司做運營,時薪差不多就是這個數;紐約一家咨詢公司的初級分析師,每小時也能拿到35美金左右。
國內呢?
我查了一下招聘網站,互聯網行業的產品經理、運營、市場這些白領,平均時薪在50到80人民幣之間,折合下來7到11美金。
哪怕是把人力外包到東南亞,菲律賓、越南的英語客服,時薪也很難低于3到5美金。
而M2.5給出的價格是:1美金/小時。這還沒完。MiniMax官方有一個補充說明:在每秒輸出50個token的模式下,這個數字還能進一步降到0.3美金/小時。
0.3美金什么概念?在北京,一瓶礦泉水的價格。在上海,一趟地鐵的價格。在硅谷,連給小費都不夠。
咱們再換一個角度算賬。
人類一天工作8小時,一年工作250天,這是法定的上限;但AI可以7x24小時連軸轉,一年365天不休。你睡覺時,它在干活,你過春節它在干活,你休年假它還在干活。
所以,真實效率比是接近200:1。
一個AI Agent ,一年能產出的工時,相當于200個全職人類員工。當然,這不是說一個AI能替代200個人,人能做很多AI做不了的事。
但這個數字告訴我們另一件事:過去因為人力成本太高而「不值得做」的事情,現在可能都值得做了。
舉個例子:
一家電商平臺,有100萬活躍用戶。理論上,如果給每個用戶做一次生日關懷、一次個性化回訪,轉化率肯定能提升;但過去這事沒人干,為什么?
因為100萬次個性化溝通,按人力成本算,得雇幾十個客服,一年幾百萬的支出,ROI算不過來。
現在呢?
一個AI Agent,1美金一小時,一天干的活相當于幾百個人類客服同時開工;100萬次個性化溝通,按人力算得幾十個人干一年,按AI算,可能幾千美金就搞定了。
所以你看,1美金/小時的意義,在于把過去「不值得」的事,變成了「值得」,把過去「只能想想」的事,變成了「可以試試」。
這就是我說的臨界點。當成本低到一定程度,決策邏輯就變了。變成什么呢?你可以隨時隨地問問AI,而且不用擔心價格問題。
02
有人肯定會滿腦子疑惑:OpenAI、Anthropic都那么強,這家公司把價格打到這個份上,靠補貼嗎?還是賠本賺吆喝?
都不是。
我看了下MiniMax發的一篇技術報告,里面有一個東西叫「Forge」的訓練體系。什么是Forge系統?它是一個會「派活」的管家。
簡單講,它讓模型學會三件事:
一,讓快的不用等慢的。真實世界里,AI干活的速度不一樣。查天氣幾秒就完事,寫代碼可能要幾小時。如果死板地按順序處理,快的就得等慢的。
Forge怎么解決?
它做了一個叫「Windowed FIFO」的調度策略,角色很清晰,手里攥著一堆任務,知道誰快誰慢,知道哪個該先派活、哪個可以等等。
比如:遇到查天氣這種快任務,管家立刻派給一個輕量級的「技能模塊」去處理;遇到寫代碼這種慢任務,管家把它交給專門的「代碼專家」,然后扭頭就去處理下一個快任務,它們互不耽誤,異步協同。
結果是整體效率最大化,同樣一臺機器,能產出更多活,單位成本自然就降下來了。
第二件事,讓「反復算舊賬」這事不再發生。
Agent干貨有個特點,它會反復調用模型,每次調用都帶著長長的歷史記錄。比如:你跟它聊了50句,第51句時它還得把前50句都「回憶」一遍。
傳統方法里,這相當于每次都要從頭算一遍歷史,就像我們每天上班,都得重新讀一遍過去一周的聊天記錄才能開始干活,你說累不累?
Forge也很煩,它做了一個叫「前綴樹合并」的創新,所有共享歷史的請求,只算一次。
舉個例子:
你問AI「幫我寫一個電商網站」,接著又說再加個購物車功能,Forge則直接把新功能「嫁接」上去,只算新增的部分。
![]()
注釋:圖里上半部分是傳統做法:三個請求,每個都帶著長長的公共前綴,重復計算三次;下半部分是Forge的做法:把公共前綴合并成一棵樹,只算一次。40倍加速,就是這么省出來的。
官方數據是:40倍訓練加速;同樣一筆算力預算,別人能訓練1次,Forge能訓練40次。經驗值的差距,就是這樣拉開的。
光拉開差距還不夠。Forge還在意一件事:過程。
過去訓練AI,往只看最終結果,比如,代碼跑通了,好;沒跑通,不好。這叫稀疏獎勵;問題是,中間走了多少彎路、浪費了多少時間,系統不管。
Forge引入了過程獎勵。它除了看結果,還看中間步驟,類似有沒有亂用工具?是不是繞了遠路?完成任務花了多長時間?這些都會被計入「獎懲」。
于是,這讓模型學會了「又快又好」地干活;是真的在琢磨,怎么用最短的路徑把事辦成。
這直接解釋了為什么M2.5能做到推理速度是其他模型的兩倍,因為它被訓練成了一個追求效率的「職場老手」,而非一個為了刷題不惜熬夜的「考試機器」。
所以,1美金/小時怎么來的?
靠一套系統工程,把訓練和推理中的每一份算力都榨干,把每一處冗余都去掉,一點一點摳出來的。
我非常認可一個觀點,當推理消耗變成生產資料,模型廠商就有機會把「算力稀缺」通過分層定價轉化為毛利,M2.5的1美金,是把算力從「資源」變成「生產資料」的開始。
換句話說,MiniMax在重構成本結構;這兩件事,看著結果一樣,但指向完全不同的未來。
03
未來會怎么樣?1美金的AI,會怎么改變各行各業?
咱們把賬再往下算一層,先說結論,它意味著一個「永遠在線、從不請假、時薪只要1美金」的員工,是可以直接放進業務流程里的那種。
咱們試著拆一下成本怎么一層一層傳導下去的。
MiniMax M2.5算力中心那一層,MoE架構、PD分離、全局KV緩存,這些技術名詞不展開,只說結果,單位算力的產出翻了一倍不止,原來跑一個模型需要兩臺機器,現在一臺就夠了。
再說模型廠商,Forge系統的40倍訓練加速,把研發成本攤薄了,原來花1億美金訓練出來的能力,現在花250萬就能搞定。
至于API,100 TPS吞吐量,意味著每一塊錢能買到更多的token。原來1塊錢買1000個token,現在能買3000個。
注意,100 TPS什么意思呢?
打個比方:可以把大模型想象成一家餐廳的后廚,TPS是「每秒能出多少道菜」;普通后廚一秒鐘出兩道菜,高峰期就堵死了;M2.5的后廚一秒鐘能出100道菜,哪怕客人排長隊,它也能流水一樣往外端。
這個「出菜速度」落在企業端,就是另一回事了。
原來你做一個批量任務,比如:生成1萬條商品描述,得等半天才能拿到結果。現在同樣的任務,幾分鐘就干完了。這意味著你可以把離線跑批」變成「實時響應」。
落到消費者這邊,感受更直接。你跟AI聊天,它回一句要等兩三秒,你會覺得卡;如果它秒回,你就感覺順。這100 TPS,就是把卡變成順的那道坎。
所以,別小看這個數字,它是技術指標,更是用戶體驗的分水嶺,也是單位成本能打下來的底氣所在。好,賬算清楚了。那這筆賬落在真實世界里,長什么樣?
我就隨便挑兩個場景:
一個是服務業。以前客服、售后、用戶運營這些崗位,永遠是抽樣服務,100個用戶進來,能覆蓋20個就算不錯了,因為人就那么多,時間就那么多。
現在一個AI Agent可以7x24小時在線,每個用戶進來都能被照顧到。不是「抽樣」,是「全覆蓋」。
你想想,年費幾十萬的SaaS客戶,以前只能在工作時間找客服;現在半夜三點遇到問題,AI能秒回,這難道不是體驗重構嗎?
另一個,中小企業。
小公司請不起法務、請不起財務、請不起市場總監,因為這些人太貴了;現在你可以用1美金一小時,請一個AI法務幫你審合同,請一個AI財務幫你對賬,請一個AI市場幫你.......
當然,它們目前替代不了資深專家。
所以,你發現沒有,1美金/小時的意義,超越了工業時代「省幾個人」的思維,它把過去不值得的事,變成了值得。
我看到一個報告的觀點,當模型能在編程、Agent、企業流程這些高ROI場景里,把「Token用量」穩定轉化成「省人省時省返工」的交付價值時,它就具備了穿越開源與價格戰的能力。
換句話說,幫企業算得過賬的AI,才有護城河,Minimax M2.5做到了這一切。
04
當這筆賬在所有行業都算得過時,世界會發生什么?
我換個說法,當SOTA級別的智能,變成像水電一樣按需取用的公共服務,誰會被托起來?
你可以想象一個印尼的大學生,他學編程,但買不起正版課程,請不起一對一輔導。
現在他花1美金,讓M2.5給他當助教:代碼報錯了,貼進去問;算法看不懂,讓AI用印尼語講一遍;想做個小項目賺外快,AI幫他搭框架、寫文檔。
1美金,他打一天零工能掙5美金,夠AI干五小時。
你可以想象一個肯尼亞的創業者,他在內羅畢做跨境電商,想從中國進貨,但看不懂中文的商品描述;以前他得花高價請人翻譯,現在把鏈接扔給AI,英文版規格參數、物流條款、售后政策,幾分鐘就出來了。
1美金,他能把十家中國供應商的資料翻個遍。
你還可以想象一個巴西的自由職業者;她在圣保羅接歐美的設計單子,以前只能做視覺部分,因為文案要用英語寫,她搞不定;現在她用AI寫提案、寫郵件、寫設計說明,接單范圍從拉美擴大到全球。
1美金,它打開了一個以前進不去的市場;這些不是科幻片,它們是1美金/小時落地之后,一定會發生的場景。
所以,你看,1美金在硅谷意味著便宜到忽略不計,但在雅加達、在內羅畢、在圣保羅,它意味著另一件事:第一次用得起和硅谷公司一樣的AI能力。
這聽起來像「技術普惠」的陳詞濫調,但它是真的。
歷史反復證明一件事:每一次基礎設施的平民化,都會催生一批我們想象不到的新物種。
印刷術變便宜時,沒人想到會催生報紙和小說;互聯網變便宜時,沒人想到會催生電商和短視頻;云計算變便宜時,沒人想到會催生SaaS創業的黃金十年。
我真的感嘆,現在輪到AI了。
1美金/小時,是起點。Minimax M2.5在告訴我們一件事,AI正在從奢侈品變成日用品,從稀缺資源變成基礎設施。
當一種資源變得像水和電一樣便宜時,用它來做什么,就是想象力的問題。所以,別只盯著M2.5的跑分,1美金/小時,才是這次發布真正的信號。
那問題來了:當智能像水電一樣流進千家萬戶,你想用它來做什么?春節有空時想想看。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.