阿里又發模型了。
昨晚,通義千問團隊在X上公布了Qwen3.5小模型系列,一共四個尺寸:0.8B、2B、4B、9B。
發完沒多久,馬斯克突然出現在評論區,毫不吝嗇地留下一句“Impressive intelligence density(令人印象深刻的智能密度)”。
![]()
圖源:X
消息傳回國內,很快就有了“馬斯克點贊中國AI”的話題。
可以理解。畢竟馬斯克這個名字,自帶流量。但說實話,如果把注意力全放在“馬斯克點贊”這件事上,反而可能錯過真正有意思的東西。
![]()
阿里掀桌,終結參數內卷游戲
先看一個數字。
Qwen3.5-9B,參數量90億,它在GPQA Diamond上的得分是81.7。作為對比,ChatGPT有一個開源模型,參數量1200億,得分差不多。
![]()
圖源:X
也就是說,90億參數的模型,和1200億參數的模型,在同一個測試里打成了平手。
十三分之一的體積,差不多的本事。這背后是這兩年AI圈一直在琢磨的一件事:參數規模,到底是不是越大越好?
過去兩年的邏輯很簡單粗暴——誰參數多誰厲害。萬億參數的模型一個接一個往外冒,像重型卡車,馬力確實足,但油耗也驚人。
訓練一次的成本動輒上千萬美元,推理一次的電費都能讓中小公司肉疼。最后變成只有巨頭玩得起的游戲,但這顯然違背了科技發展的初衷。
因此,Qwen3.5走了另一條路。
它在架構上做了個改動:把“門控增量網絡”和“稀疏混合專家”結合起來,前向傳播的時候只激活當前任務需要的部分,不是所有神經元都撲上去。
聽起來有點繞,那我們換一種說法:假設你有一個4000萬冊的圖書館,以前每次查資料,得把整個館翻一遍。但現在有個聰明的檢索系統,只需要調那170萬冊核心藏書,就能答出差不多的答案。
這就是馬斯克說的“智能密度”——不在參數規模上堆料,在有限資源里壓榨出盡可能多的智能。
而這還不是全部。多模態能力的整合方式,藏著另一層門道。
Qwen3.5用的是“早期融合”——文本、圖像、視頻在底層就一起處理了,不像很多模型那樣,先有個文本模型,再在外面掛個視覺編碼器當附件。
這種差別,直接讓0.8B這種迷你模型的表現同樣征服了一眾開發者——它在語言基準MMLU-Pro上只拿到了29.7分,但在視覺任務MathVista上沖到了62.2,OCRBench拿了74.5。
有開發者甚至已經想到了該模型的應用價值,直言:“本地人工智能終于開始變得實用了。”
![]()
圖源:X
![]()
跑分是起點,場景才是終局
跑分歸跑分。真正讓開發者興奮的,是另一件事。
有人算了一筆賬:現在3萬美元的硬件,就能跑出去年需要20萬美元GPU才有的推理能力。
![]()
圖源:X
還有人直接上手演示——在iPhone 17 Pro上,用針對Apple Silicon優化的MLX框架,本地跑Qwen3.5-2B的6-bit版本,實時視覺理解、實時問答,全都跑得動。
![]()
圖源:X
這意味著什么?意味著普通人終于能用得起AI了!
意味著你可以不用聯網,不用把需求上傳到誰的云端,就能在自己手機里,有一個能看、能聽、能琢磨事兒的AI。
這背后其實是一個正在發生的轉變。
智能手機時代本質上是“單向輸入”的范式——你對著屏幕戳戳點點,手機給你反饋。
但即將到來的AI硬件浪潮,路子不一樣了。AI廠商們想干的事,是用更碎、更粘的方式,滲透進你的記憶和生活。
比如你戴著一副AI眼鏡走在路上,隨口問一句前面有沒有障礙物。這時候如果AI延遲了五秒才回答,那這功能幾乎就廢了。
而這恰恰是云端大模型繞不過去的物理瓶頸——上傳、計算、返回,再快的網絡也有那點延遲。
端側小模型的價值就在這兒。遇到真需要深度推理的復雜問題,可以扔給云端;但日常的、實時的、隱私敏感的,本地搞定。
阿里已經把Qwen小模型塞進了AI眼鏡這類可穿戴設備里,能做到毫秒級的端側視覺解析。
聽說蘋果那邊也在搗鼓帶攝像頭的AirPods和新一代VR智能眼鏡——這些玩意兒,將來可能就是你的“第二雙眼睛和耳朵”。
工業方面,IoT設備、工廠傳感器、醫療監測終端,這些場景里數據隱私更敏感,本地推理同樣是硬需求。
![]()
阿里野心勃勃,模型與硬件并發
事實上,阿里的這一步,邁得比大多數人想象的要大。
3月2日,千問AI眼鏡開啟“0元預約”,G1系列疊加補貼后最低1997元,3月8日現貨發售。
同一天,巴塞羅那MWC展臺上,五米高的“Qwen”標志下,海外觀眾排著隊等試戴。
![]()
圖源:巴塞羅那MWC現場
據媒體爆料,有美國用戶試完后給出高度評價——換電設計“太妙了”,續航焦慮明顯降低,“基本可以全天開機使用智能服務”。
而這只是開始。內部人士透露,今年年內,AI指環、AI耳機也會陸續落地,面向全球發售。
你可能想問:阿里做硬件,圖什么?
表面看是跟風——Meta的Ray-Ban眼鏡吃掉了七成市場份額,OpenAI組了兩千人的硬件團隊,字節的眼鏡耳機也在路上。巨頭們都在搶同一個東西:下一個AI入口。
但阿里的打法,跟別人不太一樣。
1月底,平頭哥官網上線了一款叫“真武810E”的AI芯片。
參數上看,性能對標英偉達H20,已經在阿里云部署了多個萬卡集群,服務了國家電網、中科院、小鵬汽車等400多家客戶。更重要的是,它被大規模用于千問大模型的訓練和推理。
芯片亮相的同時,一個叫“通云哥”的黃金三角浮出水面——通義實驗室做模型,阿里云做算力,平頭哥做芯片。
三個東西捏在一起,意味著什么?意味著阿里可以在芯片架構、云平臺架構、模型架構三個層面協同優化,而不是像大多數玩家那樣,拿著英偉達的卡、跑別人的框架、調第三方的模型。
業內有一種說法:全球能做到“大模型+云+芯片”全棧自研的公司,目前只有兩家,一家是谷歌,另一家是阿里。
這個說法含金量高不高另說,但邏輯是通的——端側硬件對成本和功耗極其敏感,如果芯片、模型、云不能深度耦合,體驗上就永遠差一口氣。
千問3.5能把部署顯存占用降低60%、推理吞吐量提升19倍,靠的不只是算法,還有底層硬件的配合。
所以硬件本身,從來不是阿里的目的。
春節期間,用戶在千問APP上“一句話下單”接近2億次,Questmobile數據顯示,千問在春節期間日活沖到7352萬,以940%增幅居國內AI應用首位。
這說明:千問已經從一個聊天機器人,變成了一個能點外賣、訂酒店、打車的國民級AI助手。
現在的問題是,這個助手能不能走出手機屏幕?
當你戴著AI眼鏡路過一家餐廳,掃一眼招牌,說一句“這家評價怎么樣,幫我訂個位”,隨即眼鏡開始識別畫面,調高德的數據,用支付寶完成支付——全程不用掏手機;你在異國街頭看不懂菜單,眼鏡直接在你視野里疊上翻譯;你騎車想記錄路線,對著指環說句話就搞定。
這就是阿里想要的“所見即所得”。它依賴的不只是模型聰明,更是背后那個能觸達數百萬商家、打通支付和出行、覆蓋生活服務全場景的生態。
阿里集團CEO吳泳銘有句話說的很好:AI最大的想象力,不在手機屏幕,而在于如何接管數字世界。
從這個角度看,千問做硬件的邏輯就清晰了——它想做的,是用硬件把阿里的服務網絡,編織到現實世界的每一個節點上。
而讓這一切能夠成為可能的,正是Qwen3.5這批被馬斯克大贊的、幾十億參數的“小東西”。
作者 | 劉峰
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.