![]()
新眸原創·作者 | 棠寧
這兩天,大家聊的最多的不是又出了什么刷新榜單的新模型,也不是又簽了什么千萬級的行業訂單,而是兩個字:漲價。
就在昨天,阿里云和百度智能云同步發布了公告,旗下AI算力與存儲產品將在4月18日正式調價,最高漲幅達到34%。而在這之前,亞馬遜AWS、微軟Azure、谷歌云已經完成了一輪AI相關服務的價格上調,部分特定項目的漲幅甚至達到100%。全球云廠商集體進入算力漲價周期,沒有一家能置身事外。
打個比方,現在做大模型,就像開著車上了沒有出口的高速,油門不敢松,松了就會被后面的車瞬間超過,但油價一直在漲,油箱里的融資款越燒越少,沒人知道自己能不能撐到下一個服務區。
這話不是矯情。如果你留意阿里2026財報Q3前瞻和剛剛發布的騰訊財報,你會發現兩者最大的共通點,就是加大了對AI基礎設施與大模型研發的大額持續投入,當然,這也不可避免地讓昔日互聯網巨頭在營收增速上放慢了腳步。
幾乎在同一時間,上海的大模型創業公司MiniMax,發布了新一代旗艦大模型M2.7。和行業里常見的“參數規模再創新高”、“權威榜單全面領先”的發布邏輯不同,這款模型最核心的標簽,是“自進化”。
據官方介紹,這是全球第一個實現商用的自進化大模型,它可以深度參與自身訓練優化的全流程,在部分研發場景可承擔30%到50%的工作量。
一邊是全行業都在為算力成本、研發效率焦慮,在軍備競賽的泥潭中越陷越深;一邊是一家成立僅4年多的創業公司,讓大模型從被研發的工具,變成了研發的參與者,甚至是主體。這一槍,算是打到了行業的七寸上。
01
3年競賽,大模型的背后難點
大模型行業走到今天,整整三年時間,幾乎所有玩家都困在同一場軍備競賽里。
2023年ChatGPT引爆生成式AI浪潮的時候,行業的競爭焦點是參數規模。從百億參數到千億參數,再到萬億參數,大模型的參數膨脹速度,遠超摩爾定律曾經的節奏,仿佛參數規模就是衡量大模型能力的唯一標尺,誰家的參數更大,誰家就站在了行業的頂端。
很快,參數競賽就走到了盡頭,大家發現,參數規模的提升,帶來的能力增長越來越有限,反而對算力的需求呈指數級上漲。于是行業的競爭焦點,轉向了算力資源的爭奪。高端AI芯片的供需缺口持續擴大,國內的大模型公司紛紛鎖定長期算力訂單,行業一度出現“一卡難求”的局面,甚至有創業公司為了保障算力穩定,直接包下了整個智算中心的機柜。
到了2025年,單純的算力軍備競賽也卷不動了,行業的戰場延伸到了落地場景。大廠們紛紛把大模型和自己的云服務、硬件產品、生態體系綁定,試圖在千行百業的落地中搶到先發優勢,競爭從技術研發,蔓延到了生態、渠道、客戶資源的全面比拼。
但這場持續了三年的競賽,代價越來越沉重,已經開始影響到整個行業的發展。
大廠尚且如此,創業公司的生存壓力更是肉眼可見。我接觸過的不少大模型創業者,都有過類似的經歷:融到的第一筆錢,一半先打給了云廠商鎖定算力,剩下的錢大部分用來支付算法團隊的薪酬,留給產品打磨、場景落地的資金少之又少。行業就像一個高速運轉的跑步機,所有人都必須不停往前跑,一旦停下來就會被趕超,但跑的越快,消耗的成本就越高,陷入了“越卷越貴,越貴越卷”的死循環。
而這個問題的根源,是大模型研發效率的底層瓶頸。
傳統的大模型研發,是一套完全由人驅動的標準化流程。從最開始的數據清洗、標注,到模型架構的設計、預訓練的參數調整,再到后續的微調、對齊、評測、bug修復,每一個環節都需要大量的算法工程師、數據標注人員、產品經理深度參與。
一個千億參數級別的大模型,從立項到正式發布,往往需要一個幾百人的團隊,花費3到6個月的時間,中間還要消耗數億的算力成本。即便是迭代速度最快的頭部廠商,一個完整的大版本更新,也需要至少兩個月的研發周期。
更讓人無奈的是,這種“手工作坊”式的研發模式,正在遭遇明顯的邊際效益遞減。從GPT-3到GPT-4,再到GPT-5,OpenAI的每一次迭代,都投入了比上一次更多的算力和人力,但普通用戶能感知到的能力提升,卻越來越有限。
國內的大模型玩家也是如此,從2023年到2026年,國內已經發布了數百款大模型,參數規模越來越大,訓練數據越來越多,但真正能重構行業流程、帶來顛覆性體驗的能力突破,卻寥寥無幾。很多大模型的迭代,只是在特定榜單上的分數提升,很難轉化為用戶可感知的體驗升級。
02
自進化給大模型行業
找了個新出口
從這個角度看,MiniMax的M2.7,給大家指了一條全新的路。
M2.7的核心突破,不是參數規模的提升,或是某個特定場景能力的優化,而是對大模型研發范式的重構。
在M2.7之前,大模型在自身的研發流程里,最多只能承擔輔助工具的角色。算法工程師可以用它寫一些訓練相關的代碼,做一些簡單的數據清洗工作,但核心的模型架構設計、訓練流程控制、對齊優化等關鍵環節,還是必須由人來完成。大模型始終是一個被研發的對象,而不是研發的參與者,整個研發流程的核心驅動力,始終是人。
而M2.7的“自進化”能力,第一次讓大模型深度參與到了自身研發的全流程中。
根據MiniMax官方披露的信息,M2.7可以完成數據篩選與清洗、訓練數據的構建、模型架構的迭代優化、訓練過程中的參數調整、對齊與評測,甚至是自身推理代碼的優化等多個環節的工作。在部分特定研發流程中,M2.7可以承擔30%到50%的工作量,研發人員只需要完成頂層的目標設定、關鍵環節的審核與把控,以及最終的效果驗收。
這個變化的本質,是把大模型的研發模式,從過去的“人驅動模型迭代”,轉向了“模型驅動模型迭代”。
最直觀的改變,就是研發效率的提升和成本的下降。
同樣的一個大模型迭代版本,過去需要一個200人的算法團隊花費3個月的時間完成,現在只需要更少的人力、更短的周期就能落地,人力成本和時間成本都有顯著下降。而在算力成本上,因為M2.7可以自主優化訓練流程,調整訓練參數,提升算力的使用效率,同樣的訓練任務,消耗的算力資源也會明顯減少。對于本就面臨資金壓力的創業公司來說,這種效率的提升,直接意味著生存空間的擴大。
很多人會有疑問,讓大模型參與自己的研發,會不會犧牲基礎能力?
從官方發布的信息來看,并沒有。M2.7的編程能力已經追平了OpenAI的GPT-5.3-Codex,在多模態理解、長上下文處理、邏輯推理等核心能力上,也進入了國內大模型的第一梯隊。自進化能力的實現,沒有以犧牲基礎能力為代價,反而通過模型的自主優化,實現了基礎能力的同步提升。
對于一家成立僅4年多的創業公司來說,這樣的成績并非偶然。MiniMax成立于2022年,是國內最早一批入局大模型賽道的創業公司,此前已經發布了多個版本的通用大模型,在多模態生成、長對話等領域積累了成熟的技術能力,也沉淀了大量的模型研發數據與經驗,這些都為自進化大模型的研發提供了堅實的基礎。而這次自進化大模型的發布,也讓MiniMax從國內大模型的第二梯隊,一躍進入了技術創新的第一陣營。
M2.7的發布,之所以能在行業內引發這么大的震動,核心原因在于,它打破了大模型行業過去三年的競爭邏輯。
過去三年,大模型行業的競爭,本質上是資源的競爭。誰能拿到更多的算力,誰能組建更大的算法團隊,誰能投入更多的資金,誰就能在競爭中占據優勢。大廠憑借著自己的資金優勢、算力優勢、生態優勢,在這場競爭中占據了絕對的主導地位,創業公司想要突圍,只能在細分場景里尋找機會,很難在通用大模型的核心技術上,和大廠正面抗衡。
行業的馬太效應越來越明顯,頭部廠商占據了絕大多數的算力資源、人才資源和市場份額,中小玩家的生存空間越來越小。
但自進化大模型的出現,改變了這個游戲規則。當大模型可以自己研發自己的時候,資源的重要性會相對下降,技術創新的權重會被無限放大。創業公司不需要再和大廠拼算力、拼資金、拼團隊規模,只需要在核心技術上實現突破,就能用更少的資源,實現更快的迭代速度,在競爭中拿到自己的一席之地。
和當年的DeepSeek類似,相當于給陷入內卷的行業,打開了一條全新賽道,讓技術創新重新成為行業競爭的核心。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.