日前,一篇尚未正式發(fā)表的學(xué)術(shù)論文,引發(fā)全球存儲芯片板塊劇烈震蕩。據(jù)測算,全球主要內(nèi)存巨頭市值單日蒸發(fā)超900億美元。這篇論文就是谷歌研究院即將在國際學(xué)習(xí)表征會議(ICLR 2026)上正式亮相的論文“TurboQuant”。
在引發(fā)軒然大波后,論文原作者發(fā)文澄清,指控 Google TurboQuant 嚴(yán)重歪曲了他們的算法成果。
![]()
大家好,我叫高健揚(yáng),目前在蘇黎世聯(lián)邦理工學(xué)院做博士后,我是RaBitQ系列工作的第一作者。
Google Research 于2026年1月被 ICLR 2026會議接收的論文 ”TurboQuant: Online Vector Quantization with Near-optimal Distortion Rate“ 中,有關(guān)已有的 RaBitQ 向量量化算法的描述,理論結(jié)果對比,實驗對比均存在嚴(yán)重問題(詳細(xì)情況后文會展開描述)。這些問題在論文投稿至 ICLR 2026前已被我們通過郵件明確指出,TurboQuant 團(tuán)隊也明確表示已知情,但選擇了不予修正。論文隨后被 ICLR 2026會議接收,然后通過 Google 官方渠道大規(guī)模推廣,在社交媒體瀏覽量已達(dá)到數(shù)千萬次。
我們此時公開說明,是因為錯誤的學(xué)術(shù)敘事一旦廣泛傳播,糾正的成本會越來越高。
背景:RaBitQ 是什么
RaBitQ 系列論文(如下所列)于2024年發(fā)表,提出了一種高維向量量化方法,并從理論上證明其達(dá)到了理論計算機(jī)頂級會議論文(Alon-Klartag,FOCS 2017)給出的漸近最優(yōu)誤差界。
RaBitQ(arXiv:2405.12497,2024年5月,隨后發(fā)表于頂級會議SIGMOD 2024) 擴(kuò)展版(arXiv:2409.09913,2024年9月,隨后發(fā)表于頂級會議SIGMOD 2025)
RaBitQ 的核心想法之一是在量化前對輸入向量施加隨機(jī)旋轉(zhuǎn)(random rotation /Johnson-Lindenstrauss 變換),利用旋轉(zhuǎn)后坐標(biāo)分布的性質(zhì)做向量量化,在理論上實現(xiàn)最優(yōu)誤差界。
TurboQuant 論文問題一:系統(tǒng)性地回避 TurboQuant 方法與已有 RaBitQ 方法的相似性
RaBitQ 與 TurboQuant 在方法層面有直接的結(jié)構(gòu)聯(lián)系,兩者都在量化前對輸入向量施加隨機(jī)旋轉(zhuǎn)(Johnson-Lindenstrauss 變換)。這是兩篇論文方法設(shè)計中最核心、最接近的部分。
TurboQuant 的作者在 ICLR OpenReview 審稿平臺上對審稿人的回復(fù)中,親自這樣描述自己的方法:
“We achieve this by first normalizing the vectors by their l2 norm and then applying a random rotation (隨機(jī)旋轉(zhuǎn))to ensure the entries of the vectors will have a beta distribution post rotation.”
然而在這段回復(fù)、TurboQuant 論文中的方法介紹乃至整篇論文中,從未正面說明這一結(jié)構(gòu)與 RaBitQ 完全一致。這一回避發(fā)生在以下背景之下:
2025年1月(TurboQuant 論文在 arXiv 發(fā)布的數(shù)月前),TurboQuant 論文的第二作者 Majid Daliri 主動聯(lián)系我們,請求幫助調(diào)試他自己基于 RaBitQ C++ 代碼實現(xiàn)的 Python 版本。他詳細(xì)描述了自己復(fù)現(xiàn)的步驟、代碼片段和具體報錯,這一點可以說明 TurboQuant 團(tuán)隊對 RaBitQ 的技術(shù)細(xì)節(jié)有充分的了解。之后在2025年4月他們在 arXiv 發(fā)布的論文版本,以及2025年9月他們在 ICLR 2026會議投稿的論文版本中,他們將 RaBitQ 描述為 grid-based PQ,并且在描述中忽略了 RaBitQ 中核心的 random rotation 的步驟。ICLR 的一位審稿人也在審稿意見中獨立指出:”RaBitQ and variants are similar to TurboQuant in that they all use random projection”,并明確要求更充分的討論和比較。盡管如此,在 ICLR 會議最終版本論文中,TurboQuant 的作者不僅沒有加入對 RaBitQ 討論,甚至反而還將原本正文中對 RaBitQ 不完整描述移到了附錄中。
為此,我們于2026年3月通過郵件聯(lián)系了 TurboQuant 所有作者,提出了以上問題及糾正請求后,TurboQuant 作者在回復(fù)中以
“The use of random rotation and Johnson-Lindenstrauss transformations has become a standard technique in the field, and it is not feasible for us to cite every method that employs them.”
為由拒絕了這一請求。我們認(rèn)為這一回應(yīng)是在轉(zhuǎn)移矛盾:作為在相同問題設(shè)定下率先將隨機(jī)旋轉(zhuǎn)(Johnson-Lindenstrauss 變換)與向量量化結(jié)合、并建立最優(yōu)理論保證的具體先行工作,RaBitQ 應(yīng)當(dāng)在文中被準(zhǔn)確描述,其與 TurboQuant 方法的聯(lián)系應(yīng)當(dāng)充分討論。
TurboQuant 論文問題二:錯誤描述 RaBitQ 的理論結(jié)果
TurboQuant論文在不提供任何論據(jù)的情況下,將 RaBitQ 的理論保證定性為”次優(yōu)”。TurboQuant 論文寫道:
“While the paper’s theoretical guarantees are suboptimal, likely due to loose analysis — as practical performance surpasses theoretical bounds”
這句話直接將 RaBitQ 的理論保證定性為”次優(yōu)(suboptimal)”,將原因歸結(jié)為”較粗糙的分析(loose analysis)”。但論文沒有提供任何推導(dǎo)、對比或證據(jù)來支撐這一判斷。 事實是:我們在拓展版 RaBitQ 論文(arXiv:2409.09913)的 Theorem 3.2中,已經(jīng)嚴(yán)格證明 RaBitQ 的誤差界達(dá)到了理論計算機(jī)頂級會議論文(Alon-Klartag, FOCS 2017)給出的漸近最優(yōu)誤差界。因為這一結(jié)果,我們被邀請至理論計算機(jī)科學(xué)頂級會議 FOCS 的 Workshop 進(jìn)行報告。 為此,我們于2025年5月通過郵件與 TurboQuant 的第二作者 Majid Daliri 進(jìn)行了多輪詳細(xì)的郵件技術(shù)討論,逐條澄清了 TurboQuant 團(tuán)隊對我們理論結(jié)果的錯誤解讀。Majid Daliri 在郵件中明確表示已將這些討論告知全體共同作者。 然而后面 TurboQuant 論文在提交至 ICLR 2026、經(jīng)過審稿、被接收,最終大規(guī)模宣發(fā)的全過程中,這個對 RaBitQ 理論保證的錯誤定性始終未被修正。 一個沒有證據(jù)支撐的斷言,在被原作者具體指出錯誤、且 TurboQuant 作者方已明確知情的情況下,仍被保留在正式發(fā)表的 TurboQuant 論文中,我們認(rèn)為這已超出普通失誤的范疇。
TurboQuant 論文問題三:刻意創(chuàng)造不公平的實驗環(huán)境
TurboQuant 論文使用劣化的實現(xiàn)、關(guān)閉多線程使用單核CPU測試 RaBitQ 的效果,卻使用 A100 GPU 測試 TurboQuant 的效果。TurboQuant 報告的 RaBitQ 量化速度比我們開源實現(xiàn)的實際速度慢了數(shù)個數(shù)量級。 2025年5月的郵件中,Majid Daliri 本人解釋了這一差距的來源:
“we were using a single-core CPU instance, and multiprocessing was indeed disabled […] we weren’t fully utilizing parallelism, which explains why it was significantly slower”
我們的官方 RaBitQ 代碼在論文發(fā)布至 arXiv 時(2024年5月與2024年9月)就已經(jīng)公開,并且默認(rèn)采用多線程并行。并且,Majid Daliri 在2025年1月的郵件中還說明,他成功跑通 RaBitQ 的代碼用以測試,但他用于實驗的仍是自己翻譯的 Python 版本。這意味著,TurboQuant 論文中對 RaBitQ 速度的報告,疊加了兩層系統(tǒng)性的不公平條件:
- 使用自己翻譯的 Python 代碼,而非我們開源的 C++ 實現(xiàn)
- 使用單核CPU,關(guān)閉多線程并行測試 RaBitQ 算法,但卻使用 NVIDIA A100 GPU 測試 TurboQuant 算法
以上兩點均未在論文中充分披露。讀者看到的是 RaBitQ 比 TurboQuant 慢數(shù)個數(shù)量級這一結(jié)論,卻無從知道這一結(jié)論建立在刻意創(chuàng)造的不公平的實驗條件之上。
事件完整時間線
2024年5月:RaBitQ 論文在 arXiv 發(fā)布,同時源代碼公開(后面發(fā)表在頂級會議 SIGMOD 2024)
2024年9月:拓展版 RaBitQ 論文在 arXiv 發(fā)布,同時源代碼公開(后面發(fā)表在頂級會議 SIGMOD 2025)
2025年1月:TurboQuant 論文第二作者 Majid Daliri 聯(lián)系我們,請求協(xié)助調(diào)試 Python 版 RaBitQ 實現(xiàn)
2025年4月:TurboQuant 論文在 arXiv 發(fā)布
2025年5月:我們跟 Majid Daliri 通過郵件詢問了實驗條件的差異并清楚解釋了 RaBitQ 的理論保證最優(yōu)性, Majid Daliri 表示他已告知全體作者,但在我們要求修正 TurboQuant 論文中的事實性錯誤之后,Majid Daliri 停止回復(fù)
2025年11月:我們發(fā)現(xiàn) TurboQuant 論文被提交至 ICLR 2026會議,且論文中的事實性錯誤并未修正,為此我們聯(lián)系了 ICLR 2026 PC Chairs,未獲回應(yīng)
2026年1月:TurboQuant 論文被 ICLR 2026接收2026年3月:TurboQuant 團(tuán)隊通過 Google 官方渠道持續(xù)推廣,社交媒體相關(guān)瀏覽量已達(dá)數(shù)千萬次
2026年3月:我們正式向 TurboQuant 全體作者發(fā)送郵件,闡述以上三個事實性問題并要求做出修正及澄清。截至目前為止,我們僅收到 TurboQuant 論文第一作者 Amir Zandieh 的籠統(tǒng)答復(fù),承諾會修正問題二和問題三,但拒絕修正問題一(即討論 TurboQuant 與 RaBitQ 在技術(shù)上的相似性)。并且,他們僅愿意在 ICLR 2026正式會議結(jié)束之后才做相應(yīng)修正
我們已經(jīng)做了什么
在 ICLR OpenReview 發(fā)布公開評論:https://openreview.net/forum?id=tO3ASKZlok
向 ICLR General Chairs, PC Chairs, Code and Ethnics Chairs 再次提交正式投訴,附完整證據(jù)包
我們接下來會做什么
在 arXiv 發(fā)布詳細(xì)的關(guān)于 TurboQuant 和 RaBitQ 的技術(shù)報告
考慮向相關(guān)機(jī)構(gòu)進(jìn)一步反映
最后
我們提出這些問題,目標(biāo)是讓公共學(xué)術(shù)記錄準(zhǔn)確地反映各方法之間的真實關(guān)系。一篇論文被 Google 以數(shù)千萬曝光量推向公眾,在這種體量下,論文中錯誤的敘事不需要主動傳播,只需要不被糾正,就會自動成為共識,這也是我們選擇公開記錄的原因。
在此我們也懇請大家讓更多人知道 TurboQuant 論文背后存在的問題,我們相信真理越辯越明。
【新聞背景】
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.