337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司

<tfoot id="ccc0c"><noscript id="ccc0c"></noscript></tfoot>

<nav id="ccc0c"><cite id="ccc0c"></cite></nav>

<sup id="ccc0c"></sup>

<sup id="ccc0c"><cite id="ccc0c"></cite></sup>

<noscript id="ccc0c"><dd id="ccc0c"></dd></noscript>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

Mac 用戶本地跑大模型，這可能是目前最能打的方案

2026-04-01 21:24:23　來源: Ai學習的老章

北京舉報

0

分享至

關于本地部署和量化，我之前寫過不少：

今天聊一套讓我眼前一亮的東西——來自同一個團隊的三件套：JANG + vMLX + MLX Studio，這可能是目前最能打的方案

它們仨是啥關系？

先別被三個名字搞暈了

如果你玩過 PC 端的 GGUF + llama.cpp + Open WebUI，這三個的關系你一眼就懂：

層次

PC 端類比

Mac 端（這套）

量化格式

GGUF

JANG

推理引擎

llama.cpp

vMLX

桌面應用

Open WebUI

MLX Studio

簡單說：JANG 把大模型壓小，vMLX 把它跑快，MLX Studio 給你一個漂亮的界面。三件套，一條龍。

JANG：MLX 的量化救星

先聊最底層的 JANG，官方管自己叫"The GGUF for MLX"

說白了，就是一種混合精度量化方案

普通量化對所有參數一刀切，但模型里的 Attention 層對精度極其敏感，切太狠直接出 NaN（無效數值），模型就廢了

JANG 的聰明之處在于：對不同層給不同精度

Attention 層：保留 5~8 bit（不敢動）
MLP 層：壓到 2~4 bit（這里水分多，使勁壓）
平均額外開銷：只多 0.3 bit

效果有多猛？看這組數據——230B 參數的 MiniMax M2.5 為例：

量化方式

大小

MMLU（200 題）

JANG_2L（2bit 混合）82.5 GB74%

MLX 4-bit

119.8 GB

26.5%

MLX 3-bit

93 GB

24.5%

MLX 2-bit

68 GB

25%

MLX 在各種 bit 下都只有 25% 左右——純隨機猜測水平，模型等于報廢了。JANG 的 2bit 混合版不但活得好好的，還拿了 74%，體積反而更小。

這差距也太離譜了

更夸張的是 397B 參數的 Qwen3.5：

JANG_1L：112 GB，塞進 128 GB MacBook Pro，MMLU 86.5%
MLX 2-bit / 3-bit：NaN，直接寄
MLX 4-bit：需要約 280 GB，地球上沒幾臺 Mac 裝得下

397B 模型在筆記本上跑起來了——這句話放兩年前說出來怕是要被當成瘋子。

所有量化好的模型都放在 HuggingFace 的 JANGQ-AI 上，下載即用。想自己量化的話，代碼在 github.com/jjang-ai/jangq，Apache 2.0 開源。

vMLX：100K 上下文快 224 倍

有了好的量化模型，還得有個快引擎

vMLX 就是干這個的

安裝極簡：

pip install vmlx
vmlx serve mlx-community/Qwen3-8B-4bit

啟動后在本地http://0.0.0.0:8000提供 OpenAI + Anthropic 兼容 API，Claude Code、Anthropic SDK 這些客戶端都能直接接

vMLX 最硬核的賣點是它的五層緩存棧——其他 Mac 端引擎最多有一兩層，vMLX 全給你堆滿了：

前綴緩存：對話中重復的部分只算一次
分頁 KV 緩存：多個對話同時駐留，切換不驅逐
KV 緩存量化：q4/q8 壓縮，節省 4~8 倍內存
持續批處理：最多 256 個并發序列
磁盤緩存：重啟后立即恢復，不用重新算

五層疊加的結果就是，首個 Token 的響應速度碾壓同類：

上下文長度

vMLX

其他引擎

快多少

2.5K

0.05s

0.49s

9.7×

10K

0.08s

6.12s

76×

100K

0.65s

131s

224×

100K 上下文，別的引擎要等兩分多鐘，vMLX 不到一秒。我第一反應是"不可能"，但這是實測的 TTFT（Time to First Token），五層緩存疊加確實恐怖。

除了緩存，還有幾個值得一提的特性：

推測解碼：小模型打草稿 + 大模型驗證，提速 20~90%
Mamba / SSM 混合架構支持：Nemotron-H 這些奇葩架構只有 vMLX 能跑
20+ 內置 Agent 工具：文件讀寫、代碼搜索、Shell 執行、Git 操作、網頁搜索——全部本地運行

最后這點很有意思。vMLX 是目前唯一把 Agentic 工具內置到本地引擎里的方案，不用額外配 MCP 服務器，模型直接就能讀文件、執行命令、搜索代碼庫。這個思路比 Ollama、LM Studio 激進得多。

項目地址：github.com/jjang-ai/vmlx，Apache 2.0 開源。

MLX Studio：不碰命令行也能玩

如果你覺得命令行太折騰，MLX Studio就是給你準備的——vMLX 引擎的完整 GUI 應用，永久免費。

MLX Studio 主界面——聊天、Agent 工具、圖像生成一體化

該有的全有了：

對話：流式多輪對話、折疊式思維鏈展示（DeepSeek R1、Qwen3、GLM）、拖拽圖片做視覺分析、語音朗讀回復。

圖像生成：5 個生成模型（Flux Schnell/Dev、Z-Image Turbo、Klein 4B/9B）+ 4 個編輯模型（Qwen Image Edit、Flux Kontext、Flux Fill、Flux Klein Edit），全部本地跑，零 API 費用。

模型管理：內置 HuggingFace 瀏覽器一鍵下載、GGUF → MLX 轉換器（支持 JANG 混合精度）、菜單欄快捷切換模型。

API 集成：同時提供 OpenAI 和 Anthropic 端點，支持 Claude Code 等客戶端直接對接。原生 MCP 支持，可以掛外部工具。

老實說，從功能完整度來看，MLX Studio 比之前我試過的 oMLX 豐富不少，尤其是圖像生成和 Agent 工具這塊，oMLX 是沒有的。不過 oMLX 勝在輕量簡潔，兩者定位不太一樣。

官網：mlx.studio

總結

這三件套解決的核心問題就一個：在 Apple Silicon Mac 上把本地 AI 的體驗拉滿。

JANG解決"裝不下"——128GB Mac 跑 397B 模型，MLX 標準量化做不到
vMLX解決"跑不快"——五層緩存棧，100K 上下文快 224 倍
MLX Studio解決"用不了"——圖文生成、語音對話、Agent 編程，一個 App 搞定

三個項目全部 Apache 2.0 開源，全部免費。

有 Mac 跑本地模型需求的朋友，真的值得試試。

制作不易，如果這篇文章覺得對你有用，可否點個關注。給我個三連擊：點贊、轉發和在看。若可以再給我加個，謝謝你看我的文章，我們下篇再見！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Claude Code 源碼泄露了，有人用Python復刻了一個極簡版

機器之心Pro 2026-04-02 11:30:10
5 跟貼 5
阿里Qwen3.6-Plus性能直逼Claude，中國最強編程模型來了！

量子位 2026-04-02 15:07:20
4 跟貼 4

實測阿里Qwen3.6-Plus：8分鐘做了個官網，被北京地鐵繞暈

智東西 2026-04-02 20:10:07
0 跟貼 0

一條Claude Code 源代碼的社會性死亡

虎嗅APP 2026-04-02 07:07:53
20 跟貼 20
QVGen讓「超低比特視頻生成量化」真正可用！

機器之心Pro 2026-02-25 18:07:24
0 跟貼 0

剛剛，龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼

機器之心Pro 2026-04-02 16:37:52
0 跟貼 0

開卷視覺編程！GLM-5V-Turbo上線，一張草圖搞定前端

量子位 2026-04-02 14:23:34
0 跟貼 0
美團LongCat-Next：把圖像、聲音、文字都變成Token，然后呢？

機器之心Pro 2026-04-02 14:03:47
0 跟貼 0

剛剛，AI用4小時攻破“世界最安全開源系統”

智東西 2026-04-02 17:08:07
0 跟貼 0
別學Claude Code了！OMC五大「臥槽」功能解析：自動化開發軍團來了

鈦媒體APP 2026-04-01 11:09:53
0 跟貼 0
又是美國飛機！萬米高空引擎爆炸，所謂航空神話怎就成了奪命兇器

包明說 2026-03-31 15:07:59
25 跟貼 25
每天120萬億:Seedance 2.0和ArkClaw龍蝦,讓豆包大模型調用量炸了

機器之心Pro 2026-04-02 14:24:39
2 跟貼 2
每天燒 120 萬億 Token，這是 AI 圈最新的凡爾賽

愛范兒 2026-04-02 18:01:00
0 跟貼 0
F-22戰斗機啟動引擎，一股青煙噴涌而出

裝甲鏟史官 2026-01-25 12:20:23
0 跟貼 0
蘋果 50 年，什么都被抄走了，除了這一樣

愛范兒 2026-04-01 12:35:27
12 跟貼 12
中國為何能在能源動亂中處變不驚路透社公布一組數據

澎湃新聞 2026-04-01 22:24:09
17279 跟貼 17279
很多人說 MacBook Neo 不夠用

愛范兒 2026-03-11 07:11:25
0 跟貼 0
蘋果的 Magic，究竟在何處？

愛范兒 2026-02-11 11:25:23
0 跟貼 0
14年來最好修的蘋果電腦，MacBook Neo堪稱史詩級改變

愛范兒 2026-03-16 21:57:44
0 跟貼 0
我的天！豆包每天燒120萬億Tokens啊！

量子位 2026-04-02 20:28:55
0 跟貼 0
史詩級性價比！￥3000多的MacBook香不香？

愛范兒 2026-03-06 19:59:33
0 跟貼 0
千億賽道卡位戰！聯合動力開拓智能底盤新藍海，打開新增長空間

環球網資訊 2026-04-01 16:25:16
0 跟貼 0
40歲轉行程序員：André用18個月拆穿3個行業謊言

薛定諤的BUG 2026-04-01 09:47:26
0 跟貼 0
美方被曝醞釀最后一擊四套方案已定超30萬美軍地面作戰

一飲山河 2026-03-31 11:12:53
1 跟貼 1
參加完蘋果的一場線下活動后，我發現游戲的風向又變了

17173游戲網 2026-03-31 17:57:40
1 跟貼 1
國產版Ollama來了，Clawdbot終于不只屬于Mac和英偉達-5

機器之心Pro 2026-02-03 14:47:06
0 跟貼 0
如果你被吸入噴氣機引擎會發生什么？

夏的世界 2026-04-01 11:01:27
1 跟貼 1
男生減速帶，內燃機引擎重建

看會兒沙雕 2026-04-01 14:14:23
1 跟貼 1
大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0
"七線作戰"的以軍"瀕臨崩潰" "箭-3"攔截導彈僅剩兩成

每日經濟新聞 2026-04-01 22:11:34
5230 跟貼 5230
《英雄無敵5：重生》新情報虛幻5引擎全新打造

3DM游戲 2026-04-02 06:12:10
0 跟貼 0
上市首日大漲111%！智譜MiniMax之后，德適交出大模型商業化答卷

量子位 2026-04-02 17:49:07
0 跟貼 0
生命是大模型，但不僅僅是大語言模型

尹燁 2026-04-02 01:16:27
0 跟貼 0
上海女排奪冠背后：一座城，三個男人，二十五年再圓夢！

上觀新聞 2026-04-02 04:24:33
405 跟貼 405
58歲男子買老頭樂遭遇連環套：從9800元“小卡宴開回家”到再付13000元提車返現，最后“銷售”失聯，“售后”不管網購

大風新聞 2026-04-02 08:48:03
2865 跟貼 2865
張雪：未來5年將“吃掉”杜卡迪、雅馬哈等國際大排量摩托品牌50%以上市場份額

中國網資訊 2026-04-02 10:07:21
639 跟貼 639
擺在桌面的客機引擎，航發模型新境界

裝甲鏟史官 2026-03-01 11:29:59
0 跟貼 0
1000 倍效率神話，Taalas如何用 “模型即芯片” 暴打英偉達

鈦媒體APP 2026-02-24 15:35:10
0 跟貼 0
重慶浙江爭奪“張雪”，爭的是什么

每日經濟新聞 2026-04-01 22:31:05
191 跟貼 191
女生分享手機原相機視頻參數，素顏保留質感超簡單，新手也能輕松上手

理想之聲 2026-04-01 14:55:01
0 跟貼 0

長的太漂亮了，真正的珠圓玉潤，標準的東方美

長的太漂亮了，真正的珠圓玉潤，標準的東方美

生活新鮮市

2026-03-27 07:21:32

002032，擬10派26.3元！分紅比例近100%

002032，擬10派26.3元！分紅比例近100%

證券時報e公司

2026-04-02 21:05:44

伊朗最高領袖行蹤，突然被俄羅斯曝出，普京送美國一個關鍵機會

伊朗最高領袖行蹤，突然被俄羅斯曝出，普京送美國一個關鍵機會

天氣觀察站

2026-04-02 19:52:16

看了陳盈駿5犯離場時許利民一臉迷糊的表情，才知道，趙睿有多難

看了陳盈駿5犯離場時許利民一臉迷糊的表情，才知道，趙睿有多難

后仰大風車

2026-04-02 08:20:17

沒格局？前東家疑內涵張雪奪冠：在你來之前我們就已經是冠軍了

沒格局？前東家疑內涵張雪奪冠：在你來之前我們就已經是冠軍了

念洲

2026-04-01 09:37:02

老板娘說她屁股太大了，我該怎么回答？

老板娘說她屁股太大了，我該怎么回答？

太急張三瘋

2026-03-19 09:16:16

沒想到不翻不知道，一翻嚇一跳，張雪峰幾乎每個月都在網上喊累

沒想到不翻不知道，一翻嚇一跳，張雪峰幾乎每個月都在網上喊累

歲月有情1314

2026-03-26 12:13:10

16GB+1TB不到3000元，目前小米值得撿漏的一款手機，抓緊時間買吧

16GB+1TB不到3000元，目前小米值得撿漏的一款手機，抓緊時間買吧

科技阿維

2026-04-02 20:42:48

夫妻性生活：別再傻傻用力了！讓妻子上癮的三個技巧，男人必看！

夫妻性生活：別再傻傻用力了！讓妻子上癮的三個技巧，男人必看！

精彩分享快樂

2025-11-20 00:05:03

豬肝再次成為關注對象！醫生發現：常吃豬肝，可能會收獲4大好處

豬肝再次成為關注對象！醫生發現：常吃豬肝，可能會收獲4大好處

搖感軍事

2025-11-30 18:57:30

馬筱梅回應10大核心問題，與張蘭關系、玥兒姐弟近況全說了

馬筱梅回應10大核心問題，與張蘭關系、玥兒姐弟近況全說了

橙星文娛

2026-04-02 09:16:03

去了香港才明白：沒見誰背雙肩包、挎包，街上都是這3種包型

去了香港才明白：沒見誰背雙肩包、挎包，街上都是這3種包型

冒泡泡的魚兒

2026-03-16 11:36:19

被淘汰10年突然翻紅，銷量暴漲20%！明星紛紛佩戴出鏡，網友：便宜又好用

被淘汰10年突然翻紅，銷量暴漲20%！明星紛紛佩戴出鏡，網友：便宜又好用

上觀新聞

2026-04-02 10:37:22

“給你女兒買件好內衣吧！”中學女孩鍛煉視頻，網友都看不下去了

“給你女兒買件好內衣吧！”中學女孩鍛煉視頻，網友都看不下去了

妍妍教育日記

2026-03-30 18:38:24

爆冷掀翻衛冕冠軍！年輕主帥又美又能打，或取代宮魯鳴接手國家隊

爆冷掀翻衛冕冠軍！年輕主帥又美又能打，或取代宮魯鳴接手國家隊

萌蘭聊個球

2026-04-02 09:26:12

英媒：中東新四國集團出現

參考消息

2026-03-31 19:24:44

意媒丨意大利唯一可能進世界杯的方式……

意媒丨意大利唯一可能進世界杯的方式……

米蘭圈

2026-04-02 09:30:31

爺爺是個算命先生，臨終前告誡：有三樣東西永遠別碰，會毀了福氣

爺爺是個算命先生，臨終前告誡：有三樣東西永遠別碰，會毀了福氣

千秋文化

2026-03-16 22:02:06

羅技翻車被抵制！隔壁雷蛇笑醒：新鼠標首發即斷貨

羅技翻車被抵制！隔壁雷蛇笑醒：新鼠標首發即斷貨

快科技

2026-04-02 19:26:48

這面相太好了，妥妥旺夫相，膀大腰圓氣血足，穿著干凈舒服!

這面相太好了，妥妥旺夫相，膀大腰圓氣血足，穿著干凈舒服!

可樂談情感

2026-03-29 15:16:24

Ai學習的老章

Ai學習的老章

3303文章數 11122關注度

往期回顧全部

科技要聞

三年虧20億，最新估值58億，Xreal沖刺港股

頭條要聞

張雪妻子：近兩年才還清所有私人欠款我不是好命的人

頭條要聞

張雪妻子：近兩年才還清所有私人欠款我不是好命的人

體育要聞

邵佳一的改革，從讓每個人踢舒服開始

娛樂要聞

宋寧峰帶女兒出軌，張婉婷找董璇哭訴

財經要聞

市場被特朗普一句話打醒滯脹交易回歸

汽車要聞

軸距2米7/后排能蹺腿試駕后驅小車QQ3 EV

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

游戲

旅游

本地

時尚

家居要聞

歲月靜好典雅新章

經典配色晝色銀河
新婚愛巢甜蜜情趣拉滿
東方法式美學現代簡約

《紅色沙漠》主角變關二爺！國內官方太能整活了

旅游要聞

長河觀瀾｜美麗運河，德州家園

本地新聞

從學徒到世界冠軍，為什么說張雪的底氣在重慶？

少年還需少年演啊！

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<small id="cccc8"></small>

<sup id="cccc8"><code id="cccc8"></code></sup>

<noscript id="cccc8"><dd id="cccc8"></dd></noscript>

<sup id="cccc8"><code id="cccc8"></code></sup>

<nav id="cccc8"><cite id="cccc8"></cite></nav>