337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司

<nav id="iiiii"><sup id="iiiii"></sup></nav><tfoot id="iiiii"><noscript id="iiiii"></noscript></tfoot>

<nav id="iiiii"><sup id="iiiii"></sup></nav><nav id="iiiii"><sup id="iiiii"></sup></nav>

<nav id="iiiii"></nav>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

谷歌新論文把內存股價干崩了！KV cache壓縮6倍

2026-03-26 12:49:57　來源: 量子位

北京舉報

0

分享至

夢晨發自凹非寺量子位 | 公眾號 QbitAI

學術會議ICLR，居然和美光和西部數據大跌扯上關系了？

兩家存儲芯片巨頭股價大跌，沒有財報暴雷，沒有供應鏈斷裂，只是谷歌展示了一篇即將在ICLR 2026正式亮相的論文。

谷歌研究院推出TurboQuant壓縮算法，把AI推理過程中最吃內存的KV cache壓縮至少6倍，精度零損失

市場的解讀簡單粗暴，長上下文AI推理以后不需要那么多內存了，利空內存。

網友紛紛表示，這不就是美劇《硅谷》里的Pied Paper？

Pied Piper是2014年開播的HBO經典美劇《硅谷》里的虛構創業公司，核心技術就是一種“近乎無損的極限壓縮算法”。

2026年，類似的算法在現實世界居然成真了。

KVCache量化到3 bit

要理解TurboQuant為什么重要，先得理解它解決的是什么問題。

AI大模型推理時處理過的信息會臨時存在KV Cache，方便后續快速調用，不用每次從頭算起。

問題是隨著上下文窗口越來越長，內存消耗急劇膨脹。KV cache正在成為AI推理的核心瓶頸之一。

傳統的解決思路是向量量化，把高精度數據壓成低精度表示。

但尷尬的是，大部分量化方法本身也需要存儲額外的“量化常數”，每個數字要多占1到2個bit。

TurboQuant用兩個改動把這個額外開銷干到了零。

PolarQuant（極坐標量化）：

不用傳統的X、Y、Z坐標描述數據，轉而用極坐標”距離+角度”。

谷歌團隊發現，轉換后角度的分布非常集中且可預測，根本不需要額外存儲歸一化常數。

就像把“往東走3個路口，往北走4個路口”壓縮成”朝37度方向走5個路口”。

信息量不變，描述更緊湊，還省掉了坐標系本身的開銷。

QJL（量化JL變換）：

把高維數據投影后壓縮成+1或-1的符號位，完全不需要額外內存。TurboQuant用它來消除PolarQuant壓縮后殘留的微小誤差。

兩者組合后PolarQuant先用大部分bit容量捕捉數據的主要信息，QJL再用1個bit做殘差修正。

最終實現3-bit量化，無需任何訓練或微調，精度零損失。

8倍加速，Benchmark全線拉滿

谷歌團隊在Gemma和Mistral等開源模型上，跑了主流長上下文基準測試，覆蓋問答、代碼生成、摘要等多種任務。

在“大海撈針”任務上，TurboQuant在所有測試中拿下完美分數，同時KV cache內存占用縮小了至少6倍。

PolarQuant單獨使用，精度也幾乎無損。

速度提升同樣顯著。在英偉達H100 GPU上，4-bit TurboQuant計算注意力分數的速度，比32-bit未量化版本快了8倍。

不只是省內存，還更快了。

在向量搜索領域，TurboQuant同樣超越了現有最優量化方法的召回率，而且不需要針對具體數據集做調優，也不依賴低效的大碼本。

AI內存的DeepSeek時刻？

Cloudflare CEO評價“這是谷歌的DeepSeek時刻”。

他認為DeepSeek證明了用更少的資源也能訓出頂尖模型。

TurboQuant的方向類似，用更少的內存，也能跑同樣質量的推理。

谷歌表示，TurboQuant除了可以用在Gemini等大模型上，同時還能大幅提升語義搜索的效率，讓谷歌級別的萬億級向量索引查詢更快、成本更低。

不過TurboQuant目前還只是一個實驗室成果，尚未大規模部署。

更關鍵的是，它只解決推理階段的內存問題。而AI訓練環節完全不受影響。

論文地址：
https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/

[1]https://x.com/eastdakota/status/2036827179150168182?s=20

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

谷歌新論文證明LLM可以少吃80%內存，閃迪盤中跌去50億美元

DeepTech深科技 2026-03-26 13:26:34
0 跟貼 0
谷歌推出壓縮算法TurboQuant 宣稱實現約6倍內存節省

財聯社 2026-03-26 10:42:12
48 跟貼 48

一篇論文引發存儲芯片股暴跌，Google 的「DeepSeek 時刻」來了？

愛范兒 2026-03-26 13:50:20
0 跟貼 0

1000 倍效率神話，Taalas如何用 “模型即芯片” 暴打英偉達

鈦媒體APP 2026-02-24 15:35:10
0 跟貼 0
AI寫CUDA算子國產芯片不行？上交方法直線拉升，DeepSeek也適用

機器之心Pro 2026-03-26 15:59:24
0 跟貼 0

1段話喊來13個“程序員”，阿里Qoder新模式讓我躺著當CTO

量子位 2026-03-26 15:42:32
0 跟貼 0

學習機“下一站”：效果可量化

經濟觀察報 2026-03-26 15:44:04
0 跟貼 0
行業最大規模具身數據集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟貼 0

行業最大規模具身數據集！出自簡智機器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟貼 0
內存通脹“終結者”？谷歌公開最新極限壓縮算法

鈦媒體APP 2026-03-26 14:33:20
0 跟貼 0
誤差有點大而已，有什么大驚小怪的？

饒問蕊 2026-03-22 04:37:45
0 跟貼 0
Ayaneo把掌機賣到8000美元：內存漲價讓Windows掌機

我是一個粉刷匠2 2026-03-26 13:45:07
1 跟貼 1
美國模型飛機試飛，鏡頭一轉事不簡單，指揮員吃了熊心豹子膽

桔子笑笑 2026-03-23 14:56:42
1 跟貼 1
機器人進汽車廠，給波士頓動力，裝上谷歌最強大腦

機器之心Pro 2026-01-06 19:02:05
4 跟貼 4
DeepSeek推理分裂出多重人格，越社交越聰明

量子位 2026-02-04 03:32:03
0 跟貼 0
《地平線6》PC配置全面公開優化超棒

游民星空 2026-03-26 13:03:30
1 跟貼 1
中遠海運恢復海灣國家訂艙船舶暫不過霍爾木茲海峽

財聯社 2026-03-25 20:20:04
10571 跟貼 10571
美伊24小時極限拉扯！中東火藥桶隨時升級？

領略非凡 2026-03-26 06:21:02
0 跟貼 0
QVGen讓「超低比特視頻生成量化」真正可用！

機器之心Pro 2026-02-25 18:07:24
0 跟貼 0
500萬年前的芯片，20億年前的核反應堆，史前文明是否真的存在？

爆笑星空 2026-03-26 03:44:28
0 跟貼 0
于東來從30歲開始吃藥，拍CT上百次，身體出什么問題都不足為奇，哪天說不定沒了就沒了

新聞晨報 2026-03-25 21:24:37
4203 跟貼 4203
我告訴具體該怎么做，誤差管理瞄準法

不止聊臺球的烤地瓜 2026-03-25 14:23:03
13 跟貼 13
美國首次！20歲女子社交平臺成癮，法院判Meta和谷歌賠償她600萬美元

紅星新聞 2026-03-26 15:46:22
0 跟貼 0
Seq2Seq翻譯藏了3個停不下來的坑，第2個讓訓練直接崩盤

報錯免疫體 2026-03-26 12:42:42
0 跟貼 0
民間大神的極限桿法秀

啊噠體育 2026-03-23 17:53:44
17 跟貼 17
河南三個大爺自駕三輪車出游106天，總里程超3000公里，平均年齡超75歲！游歷八省，分工明確，當事人：出發前約定互不追責，子女簽字見證

大風新聞 2026-03-25 19:23:14
883 跟貼 883
美國特斯拉4S店，直接把芯片展示在外面，網友：雷總可以學一下！

奇葩搞笑站 2026-03-24 10:57:10
2 跟貼 2
千萬粉絲大V，微博賬號被禁止關注

第一財經資訊 2026-03-26 12:19:47
1 跟貼 1
足球場上的神操作，門將最后時刻極限撲救，這牛能吹一輩子！

趣笑小行星 2026-03-25 11:09:23
2 跟貼 2
都是汽車廠的淚：缺芯余悸未消，內存又來補刀

燃擎頻道 2026-03-26 15:34:06
0 跟貼 0
五年級數學中點模型求陰影部分面積

天天數理學習分享 2026-03-22 13:47:40
4 跟貼 4
登頂不負堅守深耕方致遠途——山西女籃勇奪首屆中國籃協女子籃球俱樂部杯冠軍觀察

錦繡太原 2026-03-26 06:18:03
27 跟貼 27
中國禁止AI公司Manus兩名高管離境？外交部回應

澎湃新聞 2026-03-26 15:36:31
0 跟貼 0
患者的住院檢查報告竟是偽造的，中山五院致歉，珠海市衛健局：全面排查醫療機構外送檢查報告

極目新聞 2026-03-25 17:53:18
1180 跟貼 1180
射程500誤差1500？武契奇：中方導彈精度太高了，我都有些不習慣

附允歷史觀 2026-03-23 11:23:44
0 跟貼 0
黃天鵝就雞蛋角黃素抽檢結果發布聲明，三地監管部門抽檢結果反饋，雞蛋未檢出角黃素

每日經濟新聞 2026-03-25 18:11:54
1591 跟貼 1591
清華、西交聯合開源發布Cheers : 更簡潔、更高效統一多模態路線

機器之心Pro 2026-03-26 14:20:02
0 跟貼 0
3倍大的鋸子切承重墻，高報酬的背后，是拿命換錢的極限操作！

周周出精品 2026-03-25 09:55:27
21 跟貼 21
火車站“老師兒！出租車在這乘坐”標語引熱議，網友稱一看就是山東濟南，車站工作人員：在當地這是尊稱

極目新聞 2026-03-26 12:06:40
29 跟貼 29
佰維存儲：公司的解決方案已服務于包括Meta、Google、阿里、小米等眾多全球知名客戶

每日經濟新聞 2026-03-26 15:53:05
0 跟貼 0

國際油價暴跌！3月24日，全國各地各大加油站92號汽油、95號汽油、98號汽油最新油價

國際油價暴跌！3月24日，全國各地各大加油站92號汽油、95號汽油、98號汽油最新油價

吉林烏拉侯

2026-03-25 02:56:11

出大事了，特朗普被自己人切割，不到24小時，民主黨放話趕他下臺

出大事了，特朗普被自己人切割，不到24小時，民主黨放話趕他下臺

黑鷹觀軍事

2026-03-26 13:34:02

主持人問張晉：你老婆陪了劉鑾雄6年，張晉的回答如教科書般標準

主持人問張晉：你老婆陪了劉鑾雄6年，張晉的回答如教科書般標準

查爾菲的筆記

2026-03-23 18:06:01

2026年身份證就是老年證！爸媽滿60歲別辦證，這4件事千萬不能忘

2026年身份證就是老年證！爸媽滿60歲別辦證，這4件事千萬不能忘

復轉這些年

2026-03-26 09:26:17

A股：剛剛，突傳重大消息，兩個信號，周四將迎來更大級別的變盤

A股：剛剛，突傳重大消息，兩個信號，周四將迎來更大級別的變盤

云鵬敘事

2026-03-26 00:00:06

內蒙古多倫縣發生4.2級地震養殖戶：大概持續8-10秒

內蒙古多倫縣發生4.2級地震養殖戶：大概持續8-10秒

大象新聞

2026-03-26 10:41:04

自作自受！歐爾班硬剛歐盟阻援烏，160億歐元信貸被直接凍結

自作自受！歐爾班硬剛歐盟阻援烏，160億歐元信貸被直接凍結

老馬拉車莫少裝

2026-03-26 10:24:28

面對伊朗同歸于盡打法，美軍亮出王炸底牌：如果戰敗，就爆核武器

面對伊朗同歸于盡打法，美軍亮出王炸底牌：如果戰敗，就爆核武器

半壁胭脂色

2026-03-24 16:09:17

如果中國再不不恢復稀土供應，那么美國要動用真正的殺手锏

如果中國再不不恢復稀土供應，那么美國要動用真正的殺手锏

安安說

2026-03-26 11:16:21

79元太火！小米磁吸玩偶賣斷貨官方承諾加快生產

79元太火！小米磁吸玩偶賣斷貨官方承諾加快生產

快科技

2026-03-26 07:09:03

去了上海才發現；沒人穿衛衣、毛衣！滿大街都是這“魔都3件套”

去了上海才發現；沒人穿衛衣、毛衣！滿大街都是這“魔都3件套”

吃貨的分享

2026-03-26 13:00:22

光速掉粉！瑞幸被羅永浩坑慘了？！

光速掉粉！瑞幸被羅永浩坑慘了？！

廣告案例精選

2026-03-26 08:59:17

老師穿短裙蕾絲襪上課，學生連頭都不敢抬！老師穿衣底線到底在哪

老師穿短裙蕾絲襪上課，學生連頭都不敢抬！老師穿衣底線到底在哪

小羽叨叨叨

2026-03-26 13:24:34

5月1日起，全國電動車徹底“變天”，家家戶戶都要注意

5月1日起，全國電動車徹底“變天”，家家戶戶都要注意

番外行

2026-03-26 08:19:47

中國移動正式發布通知：全國將統一執行：4月30日起

中國移動正式發布通知：全國將統一執行：4月30日起

云舟史策

2026-03-26 07:34:02

國產頂級神劇，只可惜，央視播完就禁了

國產頂級神劇，只可惜，央視播完就禁了

獨立魚

2026-03-23 21:22:17

伊朗用導彈拼出尊嚴，中國導彈實力藏不住了，俄專家給出硬核定論

伊朗用導彈拼出尊嚴，中國導彈實力藏不住了，俄專家給出硬核定論

探源歷史

2026-03-25 13:22:35

突發！上海最大商場砸的62億懸了！

突發！上海最大商場砸的62億懸了！

新浪財經

2026-03-26 00:14:57

加時被打15-0，火箭苦吞恥辱紀錄！3大問題比KD丟關鍵罰球更扎眼

加時被打15-0，火箭苦吞恥辱紀錄！3大問題比KD丟關鍵罰球更扎眼

鍋子籃球

2026-03-26 15:38:12

一碗米飯六碗菜，張雪峰這頓飯，藏著他透支身體的真相

一碗米飯六碗菜，張雪峰這頓飯，藏著他透支身體的真相

王二哥老搞笑

2026-03-25 20:09:31

追蹤人工智能動態

12347文章數 176424關注度

往期回顧全部

科技要聞

Meta高管狂分百億期權，700名員工卻下崗

頭條要聞

上海媽媽尋親27年懸賞市區一套房：不用盡孝要個擁抱

頭條要聞

上海媽媽尋親27年懸賞市區一套房：不用盡孝要個擁抱

體育要聞

35歲替補門將，憑什么入選英格蘭隊？

娛樂要聞

張雪峰家人首發聲不設追思會喪事從簡

財經要聞

黃仁勛：芯片公司的時代已經結束了

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續航815km

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房產

時尚

游戲

公開課

軍事航空

房產要聞

質價比標桿！三亞首創浮島全景艙亮相，還得是萬科！

皮衣+裙，高級到炸

DOTA2 7.41版本大更新！再見了命石，選擇困難癥有福了

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

軍事要聞

擔心特朗普突然停戰以總理下令48小時盡力摧毀伊設施

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<noscript id="i8iii"></noscript>

<nav id="i8iii"></nav>

<nav id="i8iii"></nav><tr id="i8iii"></tr>

<tr id="i8iii"><small id="i8iii"></small></tr>

<tr id="i8iii"><small id="i8iii"></small></tr>