![]()
2023年,一臺(tái)M2 Ultra Mac Pro頂配賣7萬塊,現(xiàn)在官網(wǎng)直接404。蘋果把這條產(chǎn)品線連根拔起的同時(shí),悄悄給外接顯卡開了綠燈——不是給游戲,是給AI。
TinyCorp的驅(qū)動(dòng)過審那天,創(chuàng)始人George Hotz在X上發(fā)了條消息:「如果你有雷電或USB4外接顯卡盒,今天就是你們等了三年的那天。」
這句話的潛臺(tái)詞很直白:蘋果終于承認(rèn),自家芯片的AI算力天花板,靠插顯卡能捅破。
從"不支持"到"官方認(rèn)證":蘋果態(tài)度的180度轉(zhuǎn)彎
Apple Silicon(蘋果自研芯片)剛發(fā)布時(shí),外接顯卡(eGPU,External Graphics Processing Unit,外部圖形處理器)就被判了死刑。M1芯片的架構(gòu)設(shè)計(jì)把PCIe通道鎖死,雷電口只能傳數(shù)據(jù),不能跑顯卡。
用戶想插個(gè)AMD顯卡打游戲?系統(tǒng)直接不認(rèn)。想繞過限制?得關(guān)掉SIP(System Integrity Protection,系統(tǒng)完整性保護(hù)),相當(dāng)于給Mac敞開后門,風(fēng)險(xiǎn)自擔(dān)。
這次過審的TinyGPU驅(qū)動(dòng)走的完全是另一條路。它不碰圖形輸出,專攻AI計(jì)算——你的顯示器還是接在Mac上,但訓(xùn)練模型、跑大語(yǔ)言模型的活,全扔給外接的Nvidia或AMD卡。
支持名單很具體:macOS 12.1及以上,雷電3/4或USB4接口,AMD RDNA3代起(RX 7000系列),Nvidia Ampere架構(gòu)起(RTX 30系列)。
AMD卡可以原生運(yùn)行,Nvidia卡需要搭Docker Desktop走NVCC(Nvidia CUDA Compiler,英偉達(dá)CUDA編譯器)路線。配置門檻不高,但比即插即玩復(fù)雜一檔。
關(guān)鍵突破在于:不需要關(guān)SIP,不需要進(jìn)恢復(fù)模式敲代碼,安裝后系統(tǒng)設(shè)置里點(diǎn)一下"允許"就能用。
對(duì)普通用戶這只是一步,對(duì)Mac生態(tài)這是蘋果首次官方認(rèn)可外接算力擴(kuò)展。之前社區(qū)折騰的補(bǔ)丁、內(nèi)核擴(kuò)展,隨時(shí)可能被系統(tǒng)更新封殺;現(xiàn)在TinyGPU進(jìn)了白名單,穩(wěn)定性有了底層保障。
實(shí)測(cè)數(shù)據(jù):27B參數(shù)模型塞進(jìn)Mac Mini
TinyCorp放出的測(cè)試用例很敢選——Qwen 2.5 27B,阿里開源的大語(yǔ)言模型,參數(shù)量270億。這個(gè)體量之前想跑在Mac上,得M3 Max起步還得看內(nèi)存臉色。
現(xiàn)在一臺(tái)基礎(chǔ)款Mac Mini M4,外接一張RTX 4090,通過TinyGPU的tinygrad框架(一個(gè)輕量級(jí)深度學(xué)習(xí)框架)能把模型完整加載進(jìn)顯存。推理速度沒公布具體數(shù)字,但官方用了"effectively"(有效運(yùn)行)這個(gè)詞,暗示可用級(jí)別。
算力對(duì)比很直觀。M4的神經(jīng)網(wǎng)絡(luò)引擎(Neural Engine)標(biāo)稱38 TOPS(Tera Operations Per Second,每秒萬億次運(yùn)算),一張RTX 4090的FP16(半精度浮點(diǎn))算力是330 TFLOPS,差距接近一個(gè)數(shù)量級(jí)。
更關(guān)鍵的是顯存帶寬。Mac的統(tǒng)一內(nèi)存架構(gòu)被吹了很多年,但M4 Pro最高也就273GB/s;RTX 4090的GDDR6X(圖形用雙倍數(shù)據(jù)速率6X顯存)帶寬是1008GB/s,訓(xùn)練大模型時(shí)這差距會(huì)放大成訓(xùn)練時(shí)間的倍數(shù)差。
George Hotz在采訪里提過tinygrad的設(shè)計(jì)哲學(xué):不做PyTorch(一個(gè)主流深度學(xué)習(xí)框架)的復(fù)制品,而是用更少的代碼做同樣的事。整個(gè)框架核心代碼約1萬行,相比之下PyTorch超過100萬行。輕量化意味著在資源受限的設(shè)備上更容易優(yōu)化——比如Mac。
這套組合的真正價(jià)值,是把Mac從"AI消費(fèi)端"變成"AI生產(chǎn)端"。之前開發(fā)者買Mac跑AI,多是調(diào)試代碼、管理云端實(shí)例;現(xiàn)在本地能訓(xùn)能推,工作流程可以徹底離線。
Mac Pro之死與算力外包的新邏輯
時(shí)間線疊在一起看很有意思。TinyGPU過審的前幾周,蘋果官網(wǎng)撤掉了Mac Pro的產(chǎn)品頁(yè),搜索直接跳轉(zhuǎn)到Mac首頁(yè)。14年只更新3代,最后一代M2 Ultra版本上市不到兩年,成了絕響。
傳聞中的M4 Ultra沒出現(xiàn)。供應(yīng)鏈消息說芯片良率問題導(dǎo)致超大核心版本難產(chǎn),但更可能的解釋是銷量撐不起一條產(chǎn)品線——專業(yè)用戶要的是可擴(kuò)展性,蘋果給的是焊死的統(tǒng)一內(nèi)存。
Mac Pro的死亡和外接顯卡的放行,其實(shí)是同一枚硬幣的兩面。蘋果放棄了自己造"AI工作站"的執(zhí)念,轉(zhuǎn)而允許用戶用第三方硬件補(bǔ)缺口。
這套邏輯和iPhone的MagSafe(磁吸充電/配件接口)生態(tài)有點(diǎn)像:核心體驗(yàn)我控死,邊緣需求你們自己加。區(qū)別是MagSafe賣的是配件授權(quán)費(fèi),eGPU賣的是Mac的入場(chǎng)券——你總得先有一臺(tái)Mac才能插顯卡。
對(duì)開發(fā)者群體的影響正在顯現(xiàn)。機(jī)器學(xué)習(xí)工程師@swyx在X上評(píng)論:「這意味著我可以把家里的游戲PC顯卡拆下來,插到Mac Mini上寫代碼,周末再插回去打游戲。」一卡兩用,硬件利用率拉滿。
更深層的變化是軟件生態(tài)。tinygrad框架之前主要在Linux(一種開源操作系統(tǒng))社區(qū)活躍,現(xiàn)在有了官方支持的macOS版本。開發(fā)者用同一套代碼,可以在Mac本地調(diào)試、云端Linux服務(wù)器訓(xùn)練、邊緣設(shè)備部署,跨平臺(tái)摩擦大幅降低。
誰(shuí)該現(xiàn)在上車,誰(shuí)該再等等
現(xiàn)階段TinyGPU的適用場(chǎng)景很明確:本地AI推理、中小規(guī)模模型微調(diào)、隱私敏感的數(shù)據(jù)處理(醫(yī)療、金融)。不適合的是需要多卡并聯(lián)的大規(guī)模訓(xùn)練——驅(qū)動(dòng)目前只支持單卡,且沒有NVLink(英偉達(dá)多卡互聯(lián)技術(shù))支持。
成本賬要細(xì)算。一張RTX 4090現(xiàn)在市價(jià)約1.5萬,雷電顯卡塢2000-4000不等,加上Mac Mini M4基礎(chǔ)款4500,總投入2萬出頭。對(duì)比同價(jià)位能買到的Windows工作站,單卡性能接近,但Mac的功耗和噪音控制仍有優(yōu)勢(shì)。
風(fēng)險(xiǎn)在于蘋果的長(zhǎng)期承諾。驅(qū)動(dòng)過審是第一步,后續(xù)macOS更新會(huì)不會(huì)打破兼容性,取決于蘋果和TinyCorp的合作深度。參考之前eGPU的歷史——蘋果2018年官方支持過一陣,2019年后逐漸冷淡——這次能持續(xù)多久,沒人敢打包票。
George Hotz的回應(yīng)很典型:「我們開源了全部代碼,如果蘋果哪天反悔,社區(qū)可以自己維護(hù)。」tinygrad的GitHub倉(cāng)庫(kù)確實(shí)完全公開,但內(nèi)核驅(qū)動(dòng)的簽名密鑰掌握在蘋果手里,這是真正的命門。
另一個(gè)變量是Nvidia的態(tài)度。Ampere架構(gòu)的驅(qū)動(dòng)支持是社區(qū)逆向的成果,Nvidia官方從未給Mac寫過驅(qū)動(dòng)。RTX 40系列(Ada Lovelace架構(gòu))能否支持,取決于TinyCorp的逆向工程進(jìn)度和蘋果的政策容忍度。
AMD路線更穩(wěn)一些,RDNA3和即將推出的RDNA4都有開源驅(qū)動(dòng)基礎(chǔ)。但AI生態(tài)的重心明顯偏向CUDA(Nvidia的并行計(jì)算平臺(tái)),ROCm(AMD的開源GPU計(jì)算平臺(tái))的兼容性仍是硬傷。
現(xiàn)在最積極的用戶群體是兩類:已經(jīng)買了Mac但算力不夠用的開發(fā)者,以及想進(jìn)蘋果生態(tài)但被AI性能勸退的觀望者。對(duì)前者這是補(bǔ)救方案,對(duì)后者這是降低門檻的入口。
一個(gè)細(xì)節(jié)值得注意:TinyGPU的安裝流程里有一步,需要在終端運(yùn)行腳本下載驅(qū)動(dòng)。蘋果官方文檔里從沒教過用戶這樣做,但也沒阻止——這種"默許但不鼓勵(lì)"的姿態(tài),是蘋果對(duì)第三方擴(kuò)展的典型態(tài)度。
Mac Mini M4的電源適配器是內(nèi)置的,整機(jī)功耗鎖在100W以內(nèi)。外接RTX 4090后,顯卡塢單獨(dú)供電450W起步,桌面 suddenly 多了兩個(gè)電源 brick。這是蘋果設(shè)計(jì)哲學(xué)和實(shí)用主義妥協(xié)的物理痕跡。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.