337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

馬斯克大贊阿里 AI,9B 參數硬剛 120B,海外網友:這叫小模型?

0
分享至

馬斯克又雙叒叕下場點贊中國 AI 了。

昨天深夜,阿里通義千問團隊在 X 平臺正式發布了 Qwen3.5 小模型系列,覆蓋 0.8B、2B、4B 和 9B 四個參數規格。甫一發布,便在海外科技圈引發強烈反響。


馬斯克也在該推文下評論稱:「Impressive intelligence density」(令人印象深刻的智能密度)。這股熱度的背后,APPSO 也好奇,為什么這幾款小模型能夠激起如此大的波瀾?


又小又猛,憑什么

Qwen 官方在 X 平臺發帖宣布這批模型上線,言簡意賅地將其定位為「更強的智能,更少的算力」。

官方強調,四款小模型共享同一套 Qwen3.5 基礎架構,原生支持多模態,并經過架構層面的專項改良與大規模強化學習訓練。

Qwen 團隊表示,希望這批模型能更好地支撐學術研究、實驗探索與真實工業場景的創新落地,同時也宣布同步發布對應的 Base 基礎模型。


Qwen3.5 系列模型核心采用「門控增量網絡與稀疏混合專家」相結合的混合注意力架構,注意力層以 3:1 的比例排列,即 3 個 Gated DeltaNet 層搭配 1 個 Gated Attention 層。

這一設計的關鍵在于,模型在前向傳播時只激活對當前任務必要的網絡部分,而非全量計算,從而在極低延遲與算力開銷下實現高吞吐推理。


附上 HuggingFace 地址: https://huggingface.co/Qwen/Qwen3.5-2B

多模態這塊也有講究。Qwen3.5 采用「早期融合」訓練機制,文本、圖像、視頻在底層就一起處理,不是在文本模型上事后掛個視覺編碼器。

這個差異直接決定了小參數模型在視覺問答、OCR 文檔理解等任務上,能打出遠超同量級傳統輕量多模態模型的表現。

全系列同時支持長達 26 萬 Token 的上下文窗口,并引入「思考」與「非思考」雙模式,可在深度邏輯推理與快速響應之間靈活切換。

0.8B 與 2B 模型均為 24 層結構,隱藏維度分別為 1024 和 2048,專為物聯網設備等極端邊緣場景設計,也可直接在主流手機上原生運行。


盡管 0.8B 在語言基準 MMLU-Pro 上得分 29.7,表現平平,但受益于早期融合架構,其在視覺任務 MathVista 上達到 62.2,OCRBench 達到 74.5,展現出與參數量不相稱的視覺理解能力。2B 模型的 OCRBench 進一步提升至 84.5,表現亮眼。


上下滑動查看更多內容

4B 模型為 32 層結構,隱藏維度 2560,能夠流暢運行于消費級移動硬件。官方將其定性為「出乎意料強大的多模態輕量智能體底座」。

9B 則再進一步,同為 32 層結構,但隱藏維度提升至 4096,FFN 維度擴展至 12288,可以在 Mac 上流暢運行。

其 MMLU-Pro 得分達到 82.5,不僅超越了參數量為其三倍的上一代 Qwen3-30B,在視覺任務上更以兩位數優勢超過 GPT-5-Nano 與 Gemini 2.5 Flash Lite。


MMMU-Pro 得分高達 70.1,MathVision 達到 78.9,證明了其在復雜物理和數學圖像解析上的實力。官方將 9B 的目標明確為「縮小與前沿大模型的能力差距」,從基準數據來看,這一目標已初步實現。

海外開發者對這批模型的實際表現給出了高度正面的評價。

有開發者直言,稱其為「小模型」不過是低估了它,就好比把颶風叫做微風。


另有觀點認為,真正值得關注的指標是每十億參數所能釋放的智能密度。如今只需 3 萬美元的硬件,就能跑出一年前需要 20 萬美元 GPU 配置才有的推理能力。

已有開發者演示了在 iPhone 17 Pro 上通過針對 Apple Silicon 優化的 MLX 框架本地運行 Qwen3.5-2B 6-bit 版本,模型可實時完成視覺理解與問答任務。


網友在本地 Vision Agents 應用中實時識別手寫內容并即時回答問題,并感嘆這在幾個月前根本無法實現。


還有用戶這樣總結道,9B 模型性能與規模達 120B 的 ChatGPT 開源模型相當,體積卻只有其十三分之一,且完全免費,可在任何筆記本電腦乃至手機上運行。

知名開源推理工具 Ollama 也迅速跟進,官宣支持 Qwen3.5 全系四個尺寸,并配套提供原生工具調用、思維鏈推理與多模態功能,只需一行命令即可拉取運行。


附上地址:https://ollama.com/library/qwen3.5

跑分是起點,AI+硬件才是終局

在談及阿里為何堅持追求開源與發布全尺寸模型時,千問技術負責人林俊旸曾在清華 AGI-Next 峰會上轉述其師弟的觀點,給出了一個樸素的答案。

他表示,小模型起源于內部實驗需求,是為了讓資源有限的學生也能參與研究。他回憶道,7B 規模的模型已讓很多碩士博士生無力承擔實驗成本,若將 1.8B 的模型開源出去,很多同學就有機會順利畢業,「這是很好的初心」。


平心而論,Qwen 系列一路開源走下來,客觀上確實讓很多人用上了本來用不起的 AI 模型。而對于普通用戶而言,想親身體驗這批最新的小模型其實也不復雜。

目前,你可以通過 PocketPal AI 這款手機應用,直接下載并在本地運行 Qwen3.5 系列模型,無需任何 API,模型推理全程在設備端完成。 如果不習慣英文界面,可以在設置 (Setting) 里找到語言 (Language) 選項,切換成中文。


(具體教程可參考 APPSO 此前的文章:。

不過有一個細節,比選哪個模型更重要:選對量化版本。

BF16 是接近原始精度的半精度權重,回答穩定性最好,推理細節與對齊效果最接近原版,但 2B 的 BF16 權重文件就要 4.45GB,運行時還需額外占用內存用于 KV cache 和運行緩沖區,極易觸發系統殺后臺或直接加載失敗。

因此手機端的選擇邏輯應該是:可用內存長期能剩 6GB 以上,優先選 IQ4_NL;可用內存常在 3GB 至 5GB 之間,優先選 Q3_K_M;可用內存更低,才考慮 Q3_K_S 等等。


說到底,一個無法獨立運行的模型,不過是一堆權重文件。真正有價值的,是與正確硬件深度綁定、以正確量化格式部署的小模型,那才能成為真正的產品。

智能手機時代本質上是「單向輸入」的范式,而即將到來的 AI 硬件浪潮,是要以更碎片化、更有粘性的方式接管人類的記憶與生活。小模型,正是給這些硬件注入靈魂的關鍵。

阿里已將 Qwen 小模型嵌入 AI 眼鏡等可穿戴硬件,實現毫秒級端側視覺解析。在真實物理場景中,向眼鏡詢問前方障礙物時哪怕延遲三秒也會失去全部意義,而這恰恰是云端大模型無法克服的物理瓶頸。


你向眼鏡詢問前方障礙物的時候,哪怕延遲三秒也會失去全部意義,遇到需要深度推理的復雜問題,再作為路由器把請求交給云端的大模型處理。是的,端云協同架構,才是接下來幾年計算平臺的基本形態。

包括在 iPhone 的「視覺智能」中,當用戶把攝像頭對準餐廳或商品,端側實時完成場景解析、文本提取,甚至直接喚起購買流程,全程在設備上完成。


此外有媒體報道稱,蘋果下一步還在開發帶攝像頭的 AirPods 和智能眼鏡,這些設備會變成用戶的「第二雙眼睛和耳朵」。

工業方面,IoT 設備、工廠傳感器、醫療監測終端,這些場景里數據隱私更敏感,本地推理同樣是硬需求。而端側小模型實時處理第一視角多模態數據,則是繞不過去的基礎設施。

就像今天沒有人會專門寫一篇文章夸手機能打電話一樣。AI 眼鏡、AI 手表、AI 耳機等可穿戴設備,現在聽起來還有點新鮮,但在未來,它們也會變得稀松平常。

而讓這件事成為可能的,恰恰是一批又一批看似沒什么存在感的小模型。它們很小,但如無意外,它們將無處不在。


附上 HuggingFace 地址:

https://huggingface.co/collections/Qwen/qwen35

歡迎加入 APPSO AI 社群,一起暢聊 AI 產品,獲取,解鎖更多 AI 新知

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
為什么WTO很少被提起了?中國入世談判花了15年,如今幾乎被架空

為什么WTO很少被提起了?中國入世談判花了15年,如今幾乎被架空

混沌錄
2026-03-21 15:31:24
喜提第16T!東契奇對噴遭自動禁賽,湖人戰活塞折損大將

喜提第16T!東契奇對噴遭自動禁賽,湖人戰活塞折損大將

仰臥撐FTUer
2026-03-22 11:00:44
朝鮮造潛艇被擊沉!

朝鮮造潛艇被擊沉!

烽火觀天下
2026-03-20 11:41:26
34分鐘鎖單15000臺,它又爆單了!

34分鐘鎖單15000臺,它又爆單了!

汽車消費網
2026-03-20 19:06:18
官場奇案:汕頭大火燒死中紀委調查員,是天災還是人禍?

官場奇案:汕頭大火燒死中紀委調查員,是天災還是人禍?

午夜故事會
2024-03-28 11:35:01
河南小夫妻跑到澳大利亞打工,丈夫做電工,妻子做護士,年入百萬

河南小夫妻跑到澳大利亞打工,丈夫做電工,妻子做護士,年入百萬

夢回千年aa
2026-03-21 22:46:06
人到60歲后,最值得打的4種疫苗,每一針都可能在關鍵時刻救命!

人到60歲后,最值得打的4種疫苗,每一針都可能在關鍵時刻救命!

醫學科普匯
2026-03-20 20:25:06
5天5夜死戰不退!這位少尉一戰封神,榮獲“烏克蘭英雄”!

5天5夜死戰不退!這位少尉一戰封神,榮獲“烏克蘭英雄”!

老馬拉車莫少裝
2026-03-21 00:55:13
日本的頭號幫手已到位,飛機沖向中國領空!高市早苗:日本很冷靜

日本的頭號幫手已到位,飛機沖向中國領空!高市早苗:日本很冷靜

一家說
2026-03-22 08:27:36
中國太聰明了:趁著俄羅斯武器滯銷,一口氣訂購20架大飛機

中國太聰明了:趁著俄羅斯武器滯銷,一口氣訂購20架大飛機

余們搞笑段子
2026-03-22 01:31:00
杭州四季青女老板二姐被女店員撬走老公,兩人當街互撕臉面盡失

杭州四季青女老板二姐被女店員撬走老公,兩人當街互撕臉面盡失

觀世記
2026-03-21 16:28:50
愛潑斯坦案又曝新瓜,太勁爆了…

愛潑斯坦案又曝新瓜,太勁爆了…

七叔東山再起
2026-03-21 21:06:32
一不做二不休,海灣國家借刀殺人,鼓動特朗普不要半途而廢

一不做二不休,海灣國家借刀殺人,鼓動特朗普不要半途而廢

晨楓老苑
2026-03-22 11:00:07
窮游壺口瀑布被投訴?景區:這是我司資產!網友:黃河是全民的

窮游壺口瀑布被投訴?景區:這是我司資產!網友:黃河是全民的

潮鹿逐夢
2026-03-19 11:33:25
日本男子連環殺人留頭蓋骨把玩,為練習殺人偷手機意外落網

日本男子連環殺人留頭蓋骨把玩,為練習殺人偷手機意外落網

揚子晚報
2026-03-20 15:36:12
2-0到3-3,成都蓉城無緣3連勝,1人是罪魁,球迷:他咋進的國家隊

2-0到3-3,成都蓉城無緣3連勝,1人是罪魁,球迷:他咋進的國家隊

我就是一個說球的
2026-03-21 22:34:02
援助3萬噸之后,又援助6萬噸!古巴駐華大使館稱6萬噸大米已啟運

援助3萬噸之后,又援助6萬噸!古巴駐華大使館稱6萬噸大米已啟運

滄海旅行家
2026-03-21 15:00:20
殲20總師被除名:長期領導軍工央企,最近照流出,事發全過程披露

殲20總師被除名:長期領導軍工央企,最近照流出,事發全過程披露

博士觀察
2026-03-20 21:41:54
我月入2萬,老公5千,還清房貸后,我想換工作,老公讓我再掙20萬

我月入2萬,老公5千,還清房貸后,我想換工作,老公讓我再掙20萬

我是三月魚H
2026-03-20 17:50:02
重慶大學1死3傷后續!知情人透露死者是研究生,原因曝光不簡單

重慶大學1死3傷后續!知情人透露死者是研究生,原因曝光不簡單

觀察鑒娛
2026-03-22 09:06:19
2026-03-22 11:28:49
AppSo incentive-icons
AppSo
讓智能手機更好用的秘密
6209文章數 26797關注度
往期回顧 全部

科技要聞

OpenAI開啟“人海戰術” 沖刺8000人規模

頭條要聞

八國已就霍爾木茲海峽發聲 英核動力潛艇抵達阿拉伯海

頭條要聞

八國已就霍爾木茲海峽發聲 英核動力潛艇抵達阿拉伯海

體育要聞

鄭欽文兩盤橫掃前美網冠軍 迎邁阿密站開門紅

娛樂要聞

田栩寧終于涼了?出軌風波影響惡劣

財經要聞

睡夢中欠債1.2萬?這只“蝦”殺瘋了

汽車要聞

14.28萬元起 吉利銀河星耀8遠航家開啟預售

態度原創

健康
游戲
本地
手機
藝術

轉頭就暈的耳石癥,能開車上班嗎?

《紅色沙漠》按鍵反人類 官方回應正開發解決補丁

本地新聞

春色滿城關不住|紹興春日頂流,這片櫻花海藏不住了

手機要聞

華為暢享90系列下周登場:麒麟8系加持 性能史詩級提升

藝術要聞

張春橋的字藏多少心機?看似簡單卻暗藏玄機!

無障礙瀏覽 進入關懷版