網易首頁 > 網易號 > 正文申請入駐

關于MiniMax的新模型，我想說點不一樣的

2026-03-19 15:04:14　來源: 新眸深度

江蘇舉報

分享至

新眸原創·作者 | 棠寧

這兩天，大家聊的最多的不是又出了什么刷新榜單的新模型，也不是又簽了什么千萬級的行業訂單，而是兩個字：漲價。

就在昨天，阿里云和百度智能云同步發布了公告，旗下AI算力與存儲產品將在4月18日正式調價，最高漲幅達到34%。而在這之前，亞馬遜AWS、微軟Azure、谷歌云已經完成了一輪AI相關服務的價格上調，部分特定項目的漲幅甚至達到100%。全球云廠商集體進入算力漲價周期，沒有一家能置身事外。

打個比方，現在做大模型，就像開著車上了沒有出口的高速，油門不敢松，松了就會被后面的車瞬間超過，但油價一直在漲，油箱里的融資款越燒越少，沒人知道自己能不能撐到下一個服務區。

這話不是矯情。如果你留意阿里2026財報Q3前瞻和剛剛發布的騰訊財報，你會發現兩者最大的共通點，就是加大了對AI基礎設施與大模型研發的大額持續投入，當然，這也不可避免地讓昔日互聯網巨頭在營收增速上放慢了腳步。

幾乎在同一時間，上海的大模型創業公司MiniMax，發布了新一代旗艦大模型M2.7。和行業里常見的“參數規模再創新高”、“權威榜單全面領先”的發布邏輯不同，這款模型最核心的標簽，是“自進化”。

據官方介紹，這是全球第一個實現商用的自進化大模型，它可以深度參與自身訓練優化的全流程，在部分研發場景可承擔30%到50%的工作量。

一邊是全行業都在為算力成本、研發效率焦慮，在軍備競賽的泥潭中越陷越深；一邊是一家成立僅4年多的創業公司，讓大模型從被研發的工具，變成了研發的參與者，甚至是主體。這一槍，算是打到了行業的七寸上。

3年競賽，大模型的背后難點

大模型行業走到今天，整整三年時間，幾乎所有玩家都困在同一場軍備競賽里。

2023年ChatGPT引爆生成式AI浪潮的時候，行業的競爭焦點是參數規模。從百億參數到千億參數，再到萬億參數，大模型的參數膨脹速度，遠超摩爾定律曾經的節奏，仿佛參數規模就是衡量大模型能力的唯一標尺，誰家的參數更大，誰家就站在了行業的頂端。

很快，參數競賽就走到了盡頭，大家發現，參數規模的提升，帶來的能力增長越來越有限，反而對算力的需求呈指數級上漲。于是行業的競爭焦點，轉向了算力資源的爭奪。高端AI芯片的供需缺口持續擴大，國內的大模型公司紛紛鎖定長期算力訂單，行業一度出現“一卡難求”的局面，甚至有創業公司為了保障算力穩定，直接包下了整個智算中心的機柜。

到了2025年，單純的算力軍備競賽也卷不動了，行業的戰場延伸到了落地場景。大廠們紛紛把大模型和自己的云服務、硬件產品、生態體系綁定，試圖在千行百業的落地中搶到先發優勢，競爭從技術研發，蔓延到了生態、渠道、客戶資源的全面比拼。

但這場持續了三年的競賽，代價越來越沉重，已經開始影響到整個行業的發展。

大廠尚且如此，創業公司的生存壓力更是肉眼可見。我接觸過的不少大模型創業者，都有過類似的經歷：融到的第一筆錢，一半先打給了云廠商鎖定算力，剩下的錢大部分用來支付算法團隊的薪酬，留給產品打磨、場景落地的資金少之又少。行業就像一個高速運轉的跑步機，所有人都必須不停往前跑，一旦停下來就會被趕超，但跑的越快，消耗的成本就越高，陷入了“越卷越貴，越貴越卷”的死循環。

而這個問題的根源，是大模型研發效率的底層瓶頸。

傳統的大模型研發，是一套完全由人驅動的標準化流程。從最開始的數據清洗、標注，到模型架構的設計、預訓練的參數調整，再到后續的微調、對齊、評測、bug修復，每一個環節都需要大量的算法工程師、數據標注人員、產品經理深度參與。

一個千億參數級別的大模型，從立項到正式發布，往往需要一個幾百人的團隊，花費3到6個月的時間，中間還要消耗數億的算力成本。即便是迭代速度最快的頭部廠商，一個完整的大版本更新，也需要至少兩個月的研發周期。

更讓人無奈的是，這種“手工作坊”式的研發模式，正在遭遇明顯的邊際效益遞減。從GPT-3到GPT-4，再到GPT-5，OpenAI的每一次迭代，都投入了比上一次更多的算力和人力，但普通用戶能感知到的能力提升，卻越來越有限。

國內的大模型玩家也是如此，從2023年到2026年，國內已經發布了數百款大模型，參數規模越來越大，訓練數據越來越多，但真正能重構行業流程、帶來顛覆性體驗的能力突破，卻寥寥無幾。很多大模型的迭代，只是在特定榜單上的分數提升，很難轉化為用戶可感知的體驗升級。

自進化給大模型行業

找了個新出口

從這個角度看，MiniMax的M2.7，給大家指了一條全新的路。

M2.7的核心突破，不是參數規模的提升，或是某個特定場景能力的優化，而是對大模型研發范式的重構。

在M2.7之前，大模型在自身的研發流程里，最多只能承擔輔助工具的角色。算法工程師可以用它寫一些訓練相關的代碼，做一些簡單的數據清洗工作，但核心的模型架構設計、訓練流程控制、對齊優化等關鍵環節，還是必須由人來完成。大模型始終是一個被研發的對象，而不是研發的參與者，整個研發流程的核心驅動力，始終是人。

而M2.7的“自進化”能力，第一次讓大模型深度參與到了自身研發的全流程中。

根據MiniMax官方披露的信息，M2.7可以完成數據篩選與清洗、訓練數據的構建、模型架構的迭代優化、訓練過程中的參數調整、對齊與評測，甚至是自身推理代碼的優化等多個環節的工作。在部分特定研發流程中，M2.7可以承擔30%到50%的工作量，研發人員只需要完成頂層的目標設定、關鍵環節的審核與把控，以及最終的效果驗收。

這個變化的本質，是把大模型的研發模式，從過去的“人驅動模型迭代”，轉向了“模型驅動模型迭代”。

最直觀的改變，就是研發效率的提升和成本的下降。

同樣的一個大模型迭代版本，過去需要一個200人的算法團隊花費3個月的時間完成，現在只需要更少的人力、更短的周期就能落地，人力成本和時間成本都有顯著下降。而在算力成本上，因為M2.7可以自主優化訓練流程，調整訓練參數，提升算力的使用效率，同樣的訓練任務，消耗的算力資源也會明顯減少。對于本就面臨資金壓力的創業公司來說，這種效率的提升，直接意味著生存空間的擴大。

很多人會有疑問，讓大模型參與自己的研發，會不會犧牲基礎能力？

從官方發布的信息來看，并沒有。M2.7的編程能力已經追平了OpenAI的GPT-5.3-Codex，在多模態理解、長上下文處理、邏輯推理等核心能力上，也進入了國內大模型的第一梯隊。自進化能力的實現，沒有以犧牲基礎能力為代價，反而通過模型的自主優化，實現了基礎能力的同步提升。

對于一家成立僅4年多的創業公司來說，這樣的成績并非偶然。MiniMax成立于2022年，是國內最早一批入局大模型賽道的創業公司，此前已經發布了多個版本的通用大模型，在多模態生成、長對話等領域積累了成熟的技術能力，也沉淀了大量的模型研發數據與經驗，這些都為自進化大模型的研發提供了堅實的基礎。而這次自進化大模型的發布，也讓MiniMax從國內大模型的第二梯隊，一躍進入了技術創新的第一陣營。

M2.7的發布，之所以能在行業內引發這么大的震動，核心原因在于，它打破了大模型行業過去三年的競爭邏輯。

過去三年，大模型行業的競爭，本質上是資源的競爭。誰能拿到更多的算力，誰能組建更大的算法團隊，誰能投入更多的資金，誰就能在競爭中占據優勢。大廠憑借著自己的資金優勢、算力優勢、生態優勢，在這場競爭中占據了絕對的主導地位，創業公司想要突圍，只能在細分場景里尋找機會，很難在通用大模型的核心技術上，和大廠正面抗衡。

行業的馬太效應越來越明顯，頭部廠商占據了絕大多數的算力資源、人才資源和市場份額，中小玩家的生存空間越來越小。

但自進化大模型的出現，改變了這個游戲規則。當大模型可以自己研發自己的時候，資源的重要性會相對下降，技術創新的權重會被無限放大。創業公司不需要再和大廠拼算力、拼資金、拼團隊規模，只需要在核心技術上實現突破，就能用更少的資源，實現更快的迭代速度，在競爭中拿到自己的一席之地。

和當年的DeepSeek類似，相當于給陷入內卷的行業，打開了一條全新賽道，讓技術創新重新成為行業競爭的核心。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.