網易首頁 > 網易號 > 正文申請入駐

國內大模型全面被“萬億參數”卷進去了？

2025-09-29 12:06:33　來源: 科技不許冷

北京舉報

分享至

9 月 24 日的云棲大會，阿里宣布通義千問 Qwen3-Max 達到“超萬億參數”規模，訓練數據量高達 36T tokens。周靖人稱它是“通義家族最強”。這是國產大模型第一次，正式站在“萬億級”的門檻上。

這次發布會之所以格外受關注，是因為“萬億”這個詞本身的象征意義。在 AI 發展史上，每一次參數數量的跨越，都會被視作行業新紀元的標志：從 GPT-2 的 15 億參數，到 GPT-3 的 1750 億參數，再到 GPT-4 被推測接近萬億。

如今，國內廠商第一次在舞臺上宣布“我們也有萬億”，這不僅是一次產品升級，更是一次“地位宣言”。

成績同樣引人注目：在數學推理測試 AIME25 中，Qwen3-Max 取得 86.4% 的準確率，位列全球前三。在編程基準 SWE-Bench Verified 上得分 69.6%，僅次于 GPT-4.1（71.2%），位居全球第二。在 Chatbot Arena 綜合榜單中進入前五，最高位列第四。這是國產大模型首次在多項國際權威基準上全面進入世界前列。

更值得注意的是，阿里并非只推出一個“巨無霸”，而是將其切分為多個方向：Thinking 版專注復雜推理，適合科研、數學、金融分析等場景。Instruct 版擅長指令遵循，更像 ChatGPT 的日常應用版。

Omni 版則支持實時語音交互與多模態，讓用戶能夠和 AI 進行自然對話，甚至在視頻場景里實現即時反饋。對普通用戶而言，這已經不僅是一個聊天機器人，而是一個能寫代碼、能看文檔、還能聽得懂、看得見的全能助手。

但“萬億”背后，也潛藏著巨大的不確定性：這是國產大模型真正的騰飛起點，還是一場技術軍備競賽的陷阱？

為什么國內廠商沒有退路

在國際市場，OpenAI 的 GPT-4.1、Anthropic 的 Claude 已經開始追求“更輕、更靈活”。GPT-4.1 的重點是多智能體協作與 API 工具調用，Claude 則強調長文本和安全性。換句話說，他們意識到“越大越好”的階段正在過去。

而國內，卻幾乎所有巨頭都被推向了萬億參數這條單行道。

資本市場的推力最直接。2024 年，國內超過 50 家大模型公司融資總額突破 300 億元。投資人最敏感的指標不是你能否落地，而是你是否能在技術指標上追平國際巨頭。參數數值，成了最能“安撫市場”的語言。于是，“萬億”成了過關口令，誰沒到萬億，誰就可能被貼上“二線”的標簽。

企業客戶也加了一把火。在采購邏輯里，模型越大，意味著越靠譜。很多需求被天然等同于“只有萬億才行”：跨語種客服、動輒 20 萬字的合同審查、跨行業知識整合等等。哪怕實際差距只是 92% 與 93% 的準確率，在客戶眼里也足以放大成決定性的差別。于是廠商們不得不迎合這種認知，把“萬億”當成展示實力的籌碼。

更深層的原因也在于產業環境。高端 GPU 的獲取仍受限制，國內廠商在算法優化上難以直接與國際巨頭硬碰硬。于是，唯有通過“以量補質”來走捷徑：擴大參數規模，用工程手段換性能表現。就像 LCD 時代，中國廠商把背光做到極致，才在畫質上追上 OLED，如今在大模型賽道，廠商們也只能靠堆算力來追趕。

而這并不是選擇，而是被裹挾后的必然。不卷上去，就意味著退出牌桌。

冷冰冰的算力賬單

據行業測算（斯坦福 AI Index 2024 數據，結合多家券商研報），訓練一次萬億參數模型，能耗可達 2000–5000 萬度電，僅電費成本就超過上千萬元。如果算上 GPU 采購、數據清洗、分布式工程調度等全流程，完整成本可能超過數十億元。

推理階段同樣昂貴。恒信證券的一份測算指出，萬億模型的單次調用開銷，是百億模型的 2–4 倍。這意味著企業在部署時要么承擔更高的算力租賃費用，要么就要接受調用速度和穩定性的下降。

然而，性能提升卻往往只是個位數。比如在客服場景下，一個模型準確率 92%，另一個 93%，后者的訓練成本卻可能翻倍。對于企業來說，多花的不是 1%，而是實實在在的數億預算。

這就是所謂的“邊際效益遞減”。隨著參數規模越來越大，性能提升越來越有限，而能耗、賬單卻是成倍增加。對于巨頭來說，這可能是可以承受的“戰略性虧損”，但對于普通企業來說，這種成本根本不具備推廣價值。

阿里的真正野心，不止是參數

既然如此，阿里為什么還要第一個喊出“萬億”呢？

答案很清楚：阿里瞅準的并不是單純的參數競賽，而是一盤云生態的棋。

阿里的真正目標，是讓 Qwen3-Max 成為下一代阿里云的“操作系統”。在百煉平臺，它已經開放 API，按 Token 計費。Qwen3-Coder 在 OpenRouter 的調用量一度暴漲 1474%，躍居全球第二。同期推出的 Qwen3-VL、通義萬相 2.5、通義百聆，覆蓋了視頻生成、語音交互、視覺編程等核心場景。

這一套動作，意味著阿里要的不只是展示“萬億”，而是要通過 API、工具鏈，把企業和開發者的工作流牢牢綁定在阿里云的生態里。未來，當企業習慣用 Qwen 提供的代碼生成、長文檔處理、語音交互服務時，遷移成本會越來越高，最終只能留在阿里云。

換句話說，“萬億”是招牌，真正的生意在后面。阿里賣的不是模型，而是云上的智能操作系統。

萬億之后，中國要回答更大的問題

Qwen3-Max 抬高了門檻，國內廠商被迫跟進。但世界的方向，未必是越大越好。OpenAI 在推小模型和多智能體，Anthropic 在強化安全與效率，而 Meta 則通過開源 Llama 系列構建全球開發者生態。相比之下，國內的“閉源+堆參數”路線，是否會在長期競爭中失去靈活性？

這也是為什么“智能密度”概念變得重要。所謂“智能密度”，就是單位算力、單位成本下所能提供的有效智能輸出。未來的競爭，不在于誰的參數最多，而在于誰能用同樣的資源，交付更聰明、更實用的結果。

換個角度看，萬億參數確實是護城河，但可能也是最后的倔強。它能否真正轉化為產業價值，要看三點：企業是否愿意為高昂算力買單，開發者是否愿意留在生態，用戶是否能切實感受到“省錢省力”。

如果答案是肯定的，萬億參數將成為中國大模型產業的里程碑。如果不是，它可能會重演“曲面電視”的故事：技術領先，卻與用戶無關。

最后

當全球 AI 進入“智能密度”時代，中國能否從“參數軍備競賽”轉向“場景智能革命”，將決定我們是引領者，還是陪跑者。

萬億參數或許能刷榜，但只有讓用戶省下一分算力開銷，才是真正偉大的AI。

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.