337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

把8B模型塞進iPhone,這家公司讓AI速度起飛,功耗省掉80%

0
分享至

當整個 AI 行業還在比拼參數規模、堆算力時,有家初創在相反的方向發力:把模型壓縮到只剩 1 比特。

當地時間 3 月 31 日,美國 AI 初創公司 PrismML 發布了一款旗艦模型 1-bit Bonsai 8B。該模式使用 Google TPU v4 進行訓練,在接近同等性能的前提下,可將模型權重壓縮至單個比特(原生 1 比特架構)。

多項智能基準測試結果顯示,與傳統 FP16 8B 模型相比,該模型在高保真推理和語音理解能力相當的前提下,內存占用從 16GB 降至 1.15GB,推理速度提升 8 倍,能效提升 4-5 倍。在現有硬件平臺上,該模型還能將能耗降低 75% 到 80%。也就是說,該技術以更少的資源完成了相同的工作,并有效降低了能耗成本。

值得關注的是,該公司在三種主流平臺跑通了這款模型。根據技術報告,Bonsai 8B 可通過 MLX 或 Metal 接口在 Apple 設備(Mac、iPhone、iPad),也可基于 llama.cpp CUDA 在 NVIDIA GPU ,還可以通過 MLXSwift 或 OpenCL 路徑在移動端上運行。

該技術有望催生新的 AI 系統:既能在邊緣高效運行,又能在云端經濟高效擴展。讓 AI 直接在手機、筆記本電腦等消費電子設備本地運行,并有望進一步拓展至數據中心。有助于減少對云的依賴,而是基于該模型直接在設備上執行的復雜 AI 應用程序,進而解鎖機器人、可穿戴設備和個人計算應用程序等邊緣場景。

“人工智能的未來有望不再取決于誰能建造最大的數據中心,而是取決于誰能以單位能源和成本提供最大的智能。”該公司投資人、Khosla Ventures 創始人 Vinod Khosla 表示。


(來源:資料圖)

PrismML 是在加州理工學院團隊技術支持下衍生而來。目前,該公司已通過種子輪融資和 SAFE 融資籌集 1,625 萬美元,投資者包括 Khosla Ventures、Cerberus Capital 和加州理工學院。

該公司聯合創始人兼 CEO、加州理工學院教授 Babak Hassibi 稱,該技術是一種能夠適應各種硬件環境,并“在單位能耗和成本下釋放更高智能密度”的數學突破。


圖丨1-bit Bonsai 8B 的技術報告(來源:PrismML)

隨著 AI 模型規模和計算量的提升,部署高級智能技術越來越需要龐大的數據中心基礎設施。但由于延遲、硬件和隱私等方面的限制,實時、本地化的 AI 體驗仍面臨嚴峻的挑戰。

PrismML 指出了一個容易忽略的事實:在端側推理場景下,真正“卡脖子”的是內存帶寬而非算力。該公司的關鍵優勢在于,通過數年時間研發了壓縮神經網絡所需的數學理論來應對這一挑戰。

與傳統的 FP16 架構不同,PrismML 創建了具有原生 1 比特結構的模型。在不犧牲推理、編碼和通用知識能力的前提下,同時壓縮計算復雜度與內存占用。


(來源:PrismML)

根據 PrismML 發布的技術報告,他們將智能密度定義為模型智能與規模的比值(以比特為單位測量,或等效地以 GB 為單位)。按此標準衡量,1-bit Bonsai 8B 的智能密度得分達 1.06/GB。在參數數量相近的模型中,最接近的 Qwen3 8B 得分僅 0.10/GB。


(來源:PrismML)

在 MMLU-Redux 知識測試、MuSR 多步推理、GSM8K 數學解題、HumanEval+代碼生成、IFEval 指令遵循和 BFCLv3 工具調用六個維度的測試中,1-bit Bonsai 8B 的平均得分達 70.5 分,與 Qwen 3 8B 的 79.3 分差距不到 9 分,但其內存占用僅為 1.15 GB,比同類產品小約 12-14 倍。這正是智能密度的核心所在:不僅具有高性能,而且以更易于部署的方式提供性能支持。

研究人員在不同設備上進行了吞吐量數據對比。在 M4 Pro Mac 上,Bonsai 8B 的運行速度可達每秒 136 token;在 RTX 4090 上,可達每秒 440 token;在 iPhone 17 Pro Max 上,其運行速度約每秒 44 token。這些性能表現指向了一個與依賴云端的 AI 截然不同的可能性:其所帶來的體驗,可能會速度更快、更直接、更易用。

這種優勢在處理長周期智能體工作負載時更加明顯。在上面視頻的演示中,研究團隊模擬了 50 個工單匯總和分配任務。結果顯示,在相同時間窗口內,Bonsai 8B 能夠完成所有 50 個工單,而標準的 FP 16 8B 模型在同一時間段內只能完成 6 個。

對于需要持續進行多步驟推理的智能體而言,更高的吞吐量和更低的內存占用不僅能提升系統速度,還有利于擴展智能體實際完成的工作量。


圖丨各種硬件平臺的能耗對比(來源:PrismML)

從模型效率來看,Bonsai 8B 的能耗也具有優勢,而這一點與經濟效益直接相關。數據結果顯示,其遠低于 FP 16 版本,能效大約提升 4-5 倍。在 M4 Pro 上,其能耗為 0.074 毫瓦時/token,而在 iPhone 17 Pro Max 上,其能耗僅為 0.068 毫瓦時/token。


(來源:PrismML)

為進一步展示技術的擴展性,PrismML 還同步推出了兩款更小的型號:Bonsai 4B 和 Bonsai 1.7B,內存占用分別是 0.5GB 和 0.24GB。研究人員選取了從 1.2GB(Qwen3 0.6B)到 16.4GB(Qwen3 8B)的 20 款主流模型。從與同量級競品對比結果來看,PrismML 的三款模型在“智能密度”指標上具有優勢。

該公司承認技術當前仍具有局限性:一方面,這些結果仍是在通用硬件和軟件優化的前提下實現;另一方面,移動端的能耗數據來自電池耗電速率的間接估算。


如果適配專門為 1 比特模型設計的硬件,有可能減少對復雜數學乘法的需求。在此前提下 PrismML 預測,未來硬件只需執行簡單的加減運算,有望進一步將性能和能效提升 1 個數量級。

總體來說,這種“以小博大”的新范式,正在打破算力和設備之間的物理邊界:以往需要權衡取舍的場景,例如企業級本地部署、隱私敏感場景、間歇性連接環境、成本受限的 GPU 服務等,未來有望通過同一套方案覆蓋。

參考資料:

https://github.com/PrismML-Eng/Bonsai-demo/blob/main/1-bit-bonsai-8b-whitepaper.pdf

https://prismml.com/news/prismml-launches-worlds-first-1-bit-ai-model

https://prismml.com/news/bonsai-8b

https://www.wsj.com/cio-journal/caltech-researchers-claim-radical-compression-of-high-fidelity-ai-models-e66f31c9?mod=tech_feat1_ai_pos1

運營/排版:何晨龍

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
喪心病狂!邯鄲中學校長性侵15歲女生,拿20萬封口,勢力大也沒用

喪心病狂!邯鄲中學校長性侵15歲女生,拿20萬封口,勢力大也沒用

觀察鑒娛
2026-04-02 10:26:05
爺青回!《奔跑吧14》定檔來襲,老成員全回歸,這季不追都不行!

爺青回!《奔跑吧14》定檔來襲,老成員全回歸,這季不追都不行!

小椰的奶奶
2026-04-02 15:12:46
4月執行!退休人員需繳費 每月扣費金額 免繳條件全解讀

4月執行!退休人員需繳費 每月扣費金額 免繳條件全解讀

混沌錄
2026-04-02 16:08:04
傲慢出圈!姆巴佩無視老將尊嚴,指示隊友奪坎特袖標,球迷:敗人品

傲慢出圈!姆巴佩無視老將尊嚴,指示隊友奪坎特袖標,球迷:敗人品

側身凌空斬
2026-04-03 03:33:12
退休后才明白!千萬不要在兄弟姐妹面前,說出以下這5句話

退休后才明白!千萬不要在兄弟姐妹面前,說出以下這5句話

大熊歡樂坊
2026-03-06 20:37:34
1199元買10kg滾筒,小米把洗衣機做成了"裝修后悔藥"

1199元買10kg滾筒,小米把洗衣機做成了"裝修后悔藥"

閃存獵手
2026-04-02 12:16:06
排隊一個半小時仍無法進入景區,游客大喊“退票”!湖州龍之夢景區回應

排隊一個半小時仍無法進入景區,游客大喊“退票”!湖州龍之夢景區回應

齊魯壹點
2026-04-02 19:13:29
王曼昱4-0橫掃伊藤美誠僅2小時,不和諧一幕出現,發球違例遭群嘲

王曼昱4-0橫掃伊藤美誠僅2小時,不和諧一幕出現,發球違例遭群嘲

大秦壁虎白話體育
2026-04-02 16:43:11
中國反潛機更新進步,技術先進,成功鎖定日美潛艇

中國反潛機更新進步,技術先進,成功鎖定日美潛艇

籌海者
2026-04-02 08:20:17
張蘭可謂詐騙界天花板,手段之高明令人瞠目,但終難逃被全球圍剿

張蘭可謂詐騙界天花板,手段之高明令人瞠目,但終難逃被全球圍剿

玖宇維
2026-04-01 20:59:33
幾乎全是假貨!利潤高達2400%,咋消費者還前赴后繼爭相購買?

幾乎全是假貨!利潤高達2400%,咋消費者還前赴后繼爭相購買?

世界圈
2026-02-12 17:04:31
英媒:中國最令人佩服的,就是美歐聯手絞殺中國光伏,還能夠翻身

英媒:中國最令人佩服的,就是美歐聯手絞殺中國光伏,還能夠翻身

丁丁鯉史紀
2026-04-01 14:55:06
地鐵直達!北京28億中醫新院區,2029年建成,看病不用跑遠路

地鐵直達!北京28億中醫新院區,2029年建成,看病不用跑遠路

水泥土的搞笑
2026-04-03 00:39:39
福建艦燒毀30小時,5700人被扣押,全球唯一航母成廢鐵

福建艦燒毀30小時,5700人被扣押,全球唯一航母成廢鐵

完善法
2026-04-03 02:15:52
張雪峰反復提的這7所大學,畢業就是鐵飯碗,關鍵分數還不高!

張雪峰反復提的這7所大學,畢業就是鐵飯碗,關鍵分數還不高!

優墨出品
2026-03-30 19:24:31
金建希后半輩子有著落了,尹錫悅利用看守所漏洞,狂攬12億韓元

金建希后半輩子有著落了,尹錫悅利用看守所漏洞,狂攬12億韓元

王姐懶人家常菜
2026-04-02 19:41:18
優思益暴雷后董宇輝惹上麻煩,網友曬訂單要求假一賠十

優思益暴雷后董宇輝惹上麻煩,網友曬訂單要求假一賠十

映射生活的身影
2026-04-01 23:26:28
“這樣的外形,早戀就別想了!”母親曬兒子照片引爆評論區。

“這樣的外形,早戀就別想了!”母親曬兒子照片引爆評論區。

特約前排觀眾
2026-04-02 00:10:03
勸告邱毅:不要在錯誤的道路越走越遠

勸告邱毅:不要在錯誤的道路越走越遠

論事的老樞
2026-03-31 14:45:09
何穗被嘲“要胸沒胸、要屁股沒屁股”,為啥陳偉霆偏偏獨寵她?

何穗被嘲“要胸沒胸、要屁股沒屁股”,為啥陳偉霆偏偏獨寵她?

動物奇奇怪怪
2026-04-03 00:37:19
2026-04-03 04:59:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16526文章數 514831關注度
往期回顧 全部

科技要聞

三年虧20億,最新估值58億,Xreal沖刺港股

頭條要聞

伊朗稱擊中敵軍先進戰機 已墜入波斯灣

頭條要聞

伊朗稱擊中敵軍先進戰機 已墜入波斯灣

體育要聞

邵佳一的改革,從讓每個人踢舒服開始

娛樂要聞

《浪姐》人氣榜出爐!曾沛慈斷層第一

財經要聞

市場被特朗普一句話打醒 滯脹交易回歸

汽車要聞

軸距2米7/后排能蹺腿 試駕后驅小車QQ3 EV

態度原創

健康
數碼
旅游
教育
軍事航空

干細胞抗衰4大誤區,90%的人都中招

數碼要聞

跨界者大疆:不折騰才是掃地機的終極形態

旅游要聞

文明旅游 | 清明出行,讓文明與安全一路相伴!

教育要聞

王炸!這個區超兩成考生“搖號上高中”,北京中招格局悄然變臉?

軍事要聞

伊朗自殺無人機突進 逼退林肯號航母

無障礙瀏覽 進入關懷版