2月12日,MiniMax在北京舉行了備受矚目的新一代旗艦?zāi)P桶l(fā)布會,正式上線了MiniMax M2.5(MiniMax M2.5),這款被定位為“原生Agent生產(chǎn)級模型”的新作,憑借其在編程能力、搜索增強(qiáng)以及辦公生產(chǎn)力方面的顯著突破,迅速點(diǎn)燃了市場熱情。發(fā)布當(dāng)日,MiniMax股價(jià)單日漲幅超過20%,在隨后的幾天內(nèi)累計(jì)漲幅高達(dá)34.69%,創(chuàng)下了近五天內(nèi)34.69%的漲幅記錄。
![]()
![]()
一、模型定位:專為Agent場景原生設(shè)計(jì)的生產(chǎn)級解決方案
MiniMax M2.5并非一款全新技術(shù)范式的模型,而是在M2.1基礎(chǔ)上進(jìn)行的大幅度工程優(yōu)化和能力增強(qiáng)。它延續(xù)了M系列的混合專家模型(MoE)架構(gòu),總參數(shù)規(guī)模達(dá)到了2300億,但在推理時(shí)僅激活100億參數(shù),真正實(shí)現(xiàn)了“小激活、大智慧”的高效計(jì)算。
![]()
![]()
最值得關(guān)注的是,M2.5是MiniMax首款明確定位為“原生Agent生產(chǎn)級模型”的產(chǎn)品。它通過引入名為Forge的智能體原生強(qiáng)化學(xué)習(xí)框架,將底層訓(xùn)練-推理引擎與智能體完全解耦,優(yōu)化了模型在復(fù)雜智能體任務(wù)中的響應(yīng)速度與任務(wù)分解能力。這種框架設(shè)計(jì),使M2.5在運(yùn)行SWE-Bench Verified等復(fù)雜任務(wù)時(shí),端到端運(yùn)行時(shí)間從平均31.3分鐘縮短至22.8分鐘,提升幅度達(dá)到了37%。
二、性能突破:編程能力與工具調(diào)用實(shí)現(xiàn)國產(chǎn)化第一
在編程能力方面,M2.5的表現(xiàn)尤為搶眼。它在SWE-Bench Verified權(quán)威榜單中得分達(dá)到了80.2%,在Multi-SWE-Bench中得分為51.3%,較上一代顯著提升,并且在跨語言復(fù)雜環(huán)境中超越了國際頂尖模型Claude Opus 4.6,達(dá)到了行業(yè)最好的水平。
![]()
除了編程,M2.5在搜索增強(qiáng)(Search)和工具調(diào)用(Tool)場景也表現(xiàn)出了國產(chǎn)模型的領(lǐng)跑優(yōu)勢。它在BrowseComp和Wide Search等基準(zhǔn)測試中實(shí)現(xiàn)了行業(yè)領(lǐng)先的性能,特別是在面對不熟悉的腳手架環(huán)境時(shí),展現(xiàn)出了更高的泛化能力。官方數(shù)據(jù)顯示,M2.5在真實(shí)世界專業(yè)任務(wù)中表現(xiàn)優(yōu)異,能夠通過更少的搜索輪次實(shí)現(xiàn)更好的結(jié)果,效率提升約20%。
三、核心優(yōu)勢:成本極低,效率極高
MiniMax M2.5最引人注目的不僅是性能,更是其“超級性價(jià)比”。它的運(yùn)行成本是Claude Opus 4.6的十分之一到二十分之一。以每秒100 token的速率連續(xù)工作一小時(shí),其成本僅為1美元;以每秒50 token的速率運(yùn)行,成本降至0.3美元。
![]()
官方還推出了兩個(gè)版本:M2.5和M2.5-Lightning,兩者在能力上完全相同,僅在速度上存在差異。M2.5-Lightning的吞吐量達(dá)到100 tokens/秒,是其他前沿模型的兩倍速度,價(jià)格為每百萬輸入tokens 0.3美元,每百萬輸出tokens 2.4美元。
四、市場反響:股價(jià)大漲35%,掀起國產(chǎn)化浪潮
在當(dāng)前全球AI模型高價(jià)壟斷的背景下,MiniMax M2.5的發(fā)布無疑是對市場的一次重大沖擊。其發(fā)布當(dāng)日,MiniMax股價(jià)在盤中一度超過20%,總市值突破1800億港元;在隨后的幾天內(nèi),累計(jì)漲幅高達(dá)34.69%。業(yè)內(nèi)人士指出,這不僅是MiniMax公司的重大勝利,更是國產(chǎn)大模型在成本與效率上首次實(shí)現(xiàn)“追趕并超越”的標(biāo)志性事件。
結(jié)語
MiniMax M2.5的發(fā)布,標(biāo)志著國產(chǎn)大模型在Agent場景下的性能瓶頸被成功突破。它不僅在技術(shù)上實(shí)現(xiàn)了對Claude Opus 4.6的正向超越,更在商業(yè)模式上通過極低的成本為普通開發(fā)者和企業(yè)提供了強(qiáng)大的生產(chǎn)力工具,徹底顛覆了“高性能=高成本”的傳統(tǒng)認(rèn)知,為國產(chǎn)化AI的普惠化奠定了堅(jiān)實(shí)基礎(chǔ)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.