![]()
9 月 24 日的云棲大會,阿里宣布通義千問 Qwen3-Max 達到“超萬億參數”規模,訓練數據量高達 36T tokens。周靖人稱它是“通義家族最強”。這是國產大模型第一次,正式站在“萬億級”的門檻上。
這次發布會之所以格外受關注,是因為“萬億”這個詞本身的象征意義。在 AI 發展史上,每一次參數數量的跨越,都會被視作行業新紀元的標志:從 GPT-2 的 15 億參數,到 GPT-3 的 1750 億參數,再到 GPT-4 被推測接近萬億。
如今,國內廠商第一次在舞臺上宣布“我們也有萬億”,這不僅是一次產品升級,更是一次“地位宣言”。
成績同樣引人注目:在數學推理測試 AIME25 中,Qwen3-Max 取得 86.4% 的準確率,位列全球前三。在編程基準 SWE-Bench Verified 上得分 69.6%,僅次于 GPT-4.1(71.2%),位居全球第二。在 Chatbot Arena 綜合榜單中進入前五,最高位列第四。這是國產大模型首次在多項國際權威基準上全面進入世界前列。
更值得注意的是,阿里并非只推出一個“巨無霸”,而是將其切分為多個方向:Thinking 版專注復雜推理,適合科研、數學、金融分析等場景。Instruct 版擅長指令遵循,更像 ChatGPT 的日常應用版。
Omni 版則支持實時語音交互與多模態,讓用戶能夠和 AI 進行自然對話,甚至在視頻場景里實現即時反饋。對普通用戶而言,這已經不僅是一個聊天機器人,而是一個能寫代碼、能看文檔、還能聽得懂、看得見的全能助手。
但“萬億”背后,也潛藏著巨大的不確定性:這是國產大模型真正的騰飛起點,還是一場技術軍備競賽的陷阱?
為什么國內廠商沒有退路
在國際市場,OpenAI 的 GPT-4.1、Anthropic 的 Claude 已經開始追求“更輕、更靈活”。GPT-4.1 的重點是多智能體協作與 API 工具調用,Claude 則強調長文本和安全性。換句話說,他們意識到“越大越好”的階段正在過去。
而國內,卻幾乎所有巨頭都被推向了萬億參數這條單行道。
資本市場的推力最直接。2024 年,國內超過 50 家大模型公司融資總額突破 300 億元。投資人最敏感的指標不是你能否落地,而是你是否能在技術指標上追平國際巨頭。參數數值,成了最能“安撫市場”的語言。于是,“萬億”成了過關口令,誰沒到萬億,誰就可能被貼上“二線”的標簽。
企業客戶也加了一把火。在采購邏輯里,模型越大,意味著越靠譜。很多需求被天然等同于“只有萬億才行”:跨語種客服、動輒 20 萬字的合同審查、跨行業知識整合等等。哪怕實際差距只是 92% 與 93% 的準確率,在客戶眼里也足以放大成決定性的差別。于是廠商們不得不迎合這種認知,把“萬億”當成展示實力的籌碼。
更深層的原因也在于產業環境。高端 GPU 的獲取仍受限制,國內廠商在算法優化上難以直接與國際巨頭硬碰硬。于是,唯有通過“以量補質”來走捷徑:擴大參數規模,用工程手段換性能表現。就像 LCD 時代,中國廠商把背光做到極致,才在畫質上追上 OLED,如今在大模型賽道,廠商們也只能靠堆算力來追趕。
而這并不是選擇,而是被裹挾后的必然。不卷上去,就意味著退出牌桌。
冷冰冰的算力賬單
據行業測算(斯坦福 AI Index 2024 數據,結合多家券商研報),訓練一次萬億參數模型,能耗可達 2000–5000 萬度電,僅電費成本就超過上千萬元。如果算上 GPU 采購、數據清洗、分布式工程調度等全流程,完整成本可能超過數十億元。
![]()
推理階段同樣昂貴。恒信證券的一份測算指出,萬億模型的單次調用開銷,是百億模型的 2–4 倍。這意味著企業在部署時要么承擔更高的算力租賃費用,要么就要接受調用速度和穩定性的下降。
然而,性能提升卻往往只是個位數。比如在客服場景下,一個模型準確率 92%,另一個 93%,后者的訓練成本卻可能翻倍。對于企業來說,多花的不是 1%,而是實實在在的數億預算。
這就是所謂的“邊際效益遞減”。隨著參數規模越來越大,性能提升越來越有限,而能耗、賬單卻是成倍增加。對于巨頭來說,這可能是可以承受的“戰略性虧損”,但對于普通企業來說,這種成本根本不具備推廣價值。
阿里的真正野心,不止是參數
既然如此,阿里為什么還要第一個喊出“萬億”呢?
答案很清楚:阿里瞅準的并不是單純的參數競賽,而是一盤云生態的棋。
阿里的真正目標,是讓 Qwen3-Max 成為下一代阿里云的“操作系統”。在百煉平臺,它已經開放 API,按 Token 計費。Qwen3-Coder 在 OpenRouter 的調用量一度暴漲 1474%,躍居全球第二。同期推出的 Qwen3-VL、通義萬相 2.5、通義百聆,覆蓋了視頻生成、語音交互、視覺編程等核心場景。
![]()
這一套動作,意味著阿里要的不只是展示“萬億”,而是要通過 API、工具鏈,把企業和開發者的工作流牢牢綁定在阿里云的生態里。未來,當企業習慣用 Qwen 提供的代碼生成、長文檔處理、語音交互服務時,遷移成本會越來越高,最終只能留在阿里云。
換句話說,“萬億”是招牌,真正的生意在后面。阿里賣的不是模型,而是云上的智能操作系統。
萬億之后,中國要回答更大的問題
Qwen3-Max 抬高了門檻,國內廠商被迫跟進。但世界的方向,未必是越大越好。OpenAI 在推小模型和多智能體,Anthropic 在強化安全與效率,而 Meta 則通過開源 Llama 系列構建全球開發者生態。相比之下,國內的“閉源+堆參數”路線,是否會在長期競爭中失去靈活性?
這也是為什么“智能密度”概念變得重要。所謂“智能密度”,就是單位算力、單位成本下所能提供的有效智能輸出。未來的競爭,不在于誰的參數最多,而在于誰能用同樣的資源,交付更聰明、更實用的結果。
換個角度看,萬億參數確實是護城河,但可能也是最后的倔強。它能否真正轉化為產業價值,要看三點:企業是否愿意為高昂算力買單,開發者是否愿意留在生態,用戶是否能切實感受到“省錢省力”。
如果答案是肯定的,萬億參數將成為中國大模型產業的里程碑。如果不是,它可能會重演“曲面電視”的故事:技術領先,卻與用戶無關。
最后
當全球 AI 進入“智能密度”時代,中國能否從“參數軍備競賽”轉向“場景智能革命”,將決定我們是引領者,還是陪跑者。
萬億參數或許能刷榜,但只有讓用戶省下一分算力開銷,才是真正偉大的AI。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.