《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 业界动态 > 让存储芯片暴跌的谷歌论文被指学术不端

让存储芯片暴跌的谷歌论文被指学术不端

2026-03-30
來(lái)源:芯智讯
關(guān)鍵詞: 谷歌 TurboQuant AI內存 存储芯片

近日,谷歌公布的全新AI內(nèi)存壓縮技術(shù)“TurboQuant”,引發(fā)了業(yè)界的極大關(guān)注。該技術(shù)宣稱能在不犧牲模型精準(zhǔn)度的前提下,將生成式AI推理階段最吃資源的“鍵值緩存”(KV Cache)空間需求減少到原來(lái)的1/6,并讓計(jì)算速度暴增8倍。這一突破性的技術(shù),也引發(fā)了整個(gè)市場(chǎng)對(duì)于內(nèi)存需求將斷崖式下跌的擔(dān)憂,美光、Sandisk、西部數(shù)據(jù)等存儲(chǔ)相關(guān)美股紛紛大跌。

然而,就在3月27日,蘇黎世聯(lián)邦理工學(xué)院博士后、RaBitQ系列論文第一作者高健揚(yáng)公開(kāi)發(fā)布澄清信,指控TurboQuant論文存在“系統(tǒng)性回避方法相似性”、“錯(cuò)誤描述RaBitQ的理論結(jié)果”、“刻意創(chuàng)造不公平的對(duì)比實(shí)驗(yàn)環(huán)境”等三處嚴(yán)重問(wèn)題,且這些問(wèn)題在論文投稿前已通過(guò)郵件明確告知TurboQuant團(tuán)隊(duì),對(duì)方知情卻未修正。

RaBitQ是高健揚(yáng)2024年發(fā)表的高維向量量化方法,其核心創(chuàng)新之一是在量化前對(duì)輸入向量施加隨機(jī)旋轉(zhuǎn)(Johnson-Lindenstrauss變換),并從理論上證明其達(dá)到了理論計(jì)算機(jī)頂級(jí)會(huì)議論文(Alon-Klartag, FOCS 2017)給出的漸近最優(yōu)誤差界。

以下為高健揚(yáng)發(fā)布的原文:

大家好,我叫高健揚(yáng),目前在蘇黎世聯(lián)邦理工學(xué)院做博士后,我是 RaBitQ 系列工作的第一作者。

Google Research 于2026年1月被 ICLR 2026 會(huì)議接收的論文 ”TurboQuant: Online Vector Quantization with Near-optimal Distortion Rate“ 中,有關(guān)已有的 RaBitQ 向量量化算法的描述,理論結(jié)果對(duì)比,實(shí)驗(yàn)對(duì)比均存在嚴(yán)重問(wèn)題(詳細(xì)情況后文會(huì)展開(kāi)描述)。這些問(wèn)題在論文投稿至 ICLR 2026 前已被我們通過(guò)郵件明確指出,TurboQuant 團(tuán)隊(duì)也明確表示已知情,但選擇了不予修正。論文隨后被 ICLR 2026 會(huì)議接收,然后通過(guò) Google 官方渠道大規(guī)模推廣,在社交媒體瀏覽量已達(dá)到數(shù)千萬(wàn)次。

我們此時(shí)公開(kāi)說(shuō)明,是因?yàn)殄e(cuò)誤的學(xué)術(shù)敘事一旦廣泛傳播,糾正的成本會(huì)越來(lái)越高。

背景:RaBitQ 是什么

RaBitQ 系列論文(如下所列)于2024年發(fā)表,提出了一種高維向量量化方法,并從理論上證明其達(dá)到了理論計(jì)算機(jī)頂級(jí)會(huì)議論文(Alon-Klartag, FOCS 2017)給出的漸近最優(yōu)誤差界。

RaBitQ(arXiv:2405.12497,2024年5月,隨后發(fā)表于頂級(jí)會(huì)議SIGMOD 2024) 擴(kuò)展版(arXiv:2409.09913,2024年9月,隨后發(fā)表于頂級(jí)會(huì)議SIGMOD 2025)

RaBitQ 的核心想法之一是在量化前對(duì)輸入向量施加隨機(jī)旋轉(zhuǎn)(random rotation / Johnson-Lindenstrauss 變換),利用旋轉(zhuǎn)后坐標(biāo)分布的性質(zhì)做向量量化,在理論上實(shí)現(xiàn)最優(yōu)誤差界。

TurboQuant 論文問(wèn)題一:系統(tǒng)性地回避 TurboQuant 方法與已有 RaBitQ 方法的相似性

RaBitQ 與 TurboQuant 在方法層面有直接的結(jié)構(gòu)聯(lián)系,兩者都在量化前對(duì)輸入向量施加隨機(jī)旋轉(zhuǎn)(Johnson-Lindenstrauss 變換)。這是兩篇論文方法設(shè)計(jì)中最核心、最接近的部分。

TurboQuant 的作者在 ICLR OpenReview 審稿平臺(tái)上對(duì)審稿人的回復(fù)中,親自這樣描述自己的方法:

“We achieve this by first normalizing the vectors by their l2 norm and then applying a random rotation (隨機(jī)旋轉(zhuǎn))to ensure the entries of the vectors will have a beta distribution post rotation.”

然而在這段回復(fù)、TurboQuant 論文中的方法介紹乃至整篇論文中,從未正面說(shuō)明這一結(jié)構(gòu)與 RaBitQ 完全一致。這一回避發(fā)生在以下背景之下:

2025年1月(TurboQuant 論文在 arXiv 發(fā)布的數(shù)月前),TurboQuant 論文的第二作者 Majid Daliri 主動(dòng)聯(lián)系我們,請(qǐng)求幫助調(diào)試他自己基于 RaBitQ C++ 代碼實(shí)現(xiàn)的 Python 版本。他詳細(xì)描述了自己復(fù)現(xiàn)的步驟、代碼片段和具體報(bào)錯(cuò),這一點(diǎn)可以說(shuō)明 TurboQuant 團(tuán)隊(duì)對(duì) RaBitQ 的技術(shù)細(xì)節(jié)有充分的了解。之后在2025年4月他們?cè)?arXiv 發(fā)布的論文版本,以及2025年9月他們?cè)?ICLR 2026 會(huì)議投稿的論文版本中,他們將 RaBitQ 描述為 grid-based PQ,并且在描述中忽略了 RaBitQ 中核心的 random rotation 的步驟。ICLR 的一位審稿人也在審稿意見(jiàn)中獨(dú)立指出:”RaBitQ and variants are similar to TurboQuant in that they all use random projection”,并明確要求更充分的討論和比較。盡管如此,在 ICLR 會(huì)議最終版本論文中,TurboQuant 的作者不僅沒(méi)有加入對(duì) RaBitQ 討論,甚至反而還將原本正文中對(duì) RaBitQ 不完整描述移到了附錄中。

為此,我們于2026年3月通過(guò)郵件聯(lián)系了 TurboQuant 所有作者,提出了以上問(wèn)題及糾正請(qǐng)求后,TurboQuant 作者在回復(fù)中以

“The use of random rotation and Johnson-Lindenstrauss transformations has become a standard technique in the field, and it is not feasible for us to cite every method that employs them.”

為由拒絕了這一請(qǐng)求。我們認(rèn)為這一回應(yīng)是在轉(zhuǎn)移矛盾:作為在相同問(wèn)題設(shè)定下率先將隨機(jī)旋轉(zhuǎn)(Johnson-Lindenstrauss 變換)與向量量化結(jié)合、并建立最優(yōu)理論保證的具體先行工作,RaBitQ 應(yīng)當(dāng)在文中被準(zhǔn)確描述,其與 TurboQuant 方法的聯(lián)系應(yīng)當(dāng)充分討論。

TurboQuant 論文問(wèn)題二:錯(cuò)誤描述 RaBitQ 的理論結(jié)果

TurboQuant論文在不提供任何論據(jù)的情況下,將 RaBitQ 的理論保證定性為”次優(yōu)”。TurboQuant 論文寫道:

“While the paper’s theoretical guarantees are suboptimal, likely due to loose analysis — as practical performance surpasses theoretical bounds”

這句話直接將 RaBitQ 的理論保證定性為”次優(yōu)(suboptimal)”,將原因歸結(jié)為”較粗糙的分析(loose analysis)”。但論文沒(méi)有提供任何推導(dǎo)、對(duì)比或證據(jù)來(lái)支撐這一判斷。

事實(shí)是:我們?cè)谕卣拱?RaBitQ 論文(arXiv:2409.09913)的 Theorem 3.2 中,已經(jīng)嚴(yán)格證明 RaBitQ 的誤差界達(dá)到了理論計(jì)算機(jī)頂級(jí)會(huì)議論文(Alon-Klartag, FOCS 2017)給出的漸近最優(yōu)誤差界。因?yàn)檫@一結(jié)果,我們被邀請(qǐng)至理論計(jì)算機(jī)科學(xué)頂級(jí)會(huì)議 FOCS 的 Workshop 進(jìn)行報(bào)告。 為此,我們于2025年5月通過(guò)郵件與 TurboQuant 的第二作者 Majid Daliri 進(jìn)行了多輪詳細(xì)的郵件技術(shù)討論,逐條澄清了 TurboQuant 團(tuán)隊(duì)對(duì)我們理論結(jié)果的錯(cuò)誤解讀。Majid Daliri 在郵件中明確表示已將這些討論告知全體共同作者。

然而后面 TurboQuant 論文在提交至 ICLR 2026、經(jīng)過(guò)審稿、被接收,最終大規(guī)模宣發(fā)的全過(guò)程中,這個(gè)對(duì) RaBitQ 理論保證的錯(cuò)誤定性始終未被修正。

一個(gè)沒(méi)有證據(jù)支撐的斷言,在被原作者具體指出錯(cuò)誤、且 TurboQuant 作者方已明確知情的情況下,仍被保留在正式發(fā)表的 TurboQuant 論文中,我們認(rèn)為這已超出普通失誤的范疇。

TurboQuant 論文問(wèn)題三:刻意創(chuàng)造不公平的實(shí)驗(yàn)環(huán)境

TurboQuant 論文使用劣化的實(shí)現(xiàn)、關(guān)閉多線程使用單核CPU測(cè)試 RaBitQ 的效果,卻使用 A100 GPU 測(cè)試 TurboQuant 的效果。TurboQuant 報(bào)告的 RaBitQ 量化速度比我們開(kāi)源實(shí)現(xiàn)的實(shí)際速度慢了數(shù)個(gè)數(shù)量級(jí)。 2025年5月的郵件中,Majid Daliri 本人解釋了這一差距的來(lái)源:

“we were using a single-core CPU instance, and multiprocessing was indeed disabled […] we weren’t fully utilizing parallelism, which explains why it was significantly slower”

我們的官方 RaBitQ 代碼在論文發(fā)布至 arXiv 時(shí)(2024年5月與2024年9月)就已經(jīng)公開(kāi),并且默認(rèn)采用多線程并行。并且,Majid Daliri 在2025年1月的郵件中還說(shuō)明,他成功跑通 RaBitQ 的代碼用以測(cè)試,但他用于實(shí)驗(yàn)的仍是自己翻譯的 Python 版本。這意味著,TurboQuant 論文中對(duì) RaBitQ 速度的報(bào)告,疊加了兩層系統(tǒng)性的不公平條件:

使用自己翻譯的 Python 代碼,而非我們開(kāi)源的 C++ 實(shí)現(xiàn)使用單核CPU,關(guān)閉多線程并行測(cè)試 RaBitQ 算法,但卻使用 NVIDIA A100 GPU 測(cè)試 TurboQuant 算法

以上兩點(diǎn)均未在論文中充分披露。讀者看到的是 RaBitQ 比 TurboQuant 慢數(shù)個(gè)數(shù)量級(jí)這一結(jié)論,卻無(wú)從知道這一結(jié)論建立在刻意創(chuàng)造的不公平的實(shí)驗(yàn)條件之上。

事件完整時(shí)間線

2024年5月:RaBitQ 論文在 arXiv 發(fā)布,同時(shí)源代碼公開(kāi)(后面發(fā)表在頂級(jí)會(huì)議 SIGMOD 2024)

2024年9月:拓展版 RaBitQ 論文在 arXiv 發(fā)布,同時(shí)源代碼公開(kāi)(后面發(fā)表在頂級(jí)會(huì)議 SIGMOD 2025)

2025年1月:TurboQuant 論文第二作者 Majid Daliri 聯(lián)系我們,請(qǐng)求協(xié)助調(diào)試 Python 版 RaBitQ 實(shí)現(xiàn)

2025年4月:TurboQuant 論文在 arXiv 發(fā)布

2025年5月:我們跟 Majid Daliri 通過(guò)郵件詢問(wèn)了實(shí)驗(yàn)條件的差異并清楚解釋了 RaBitQ 的理論保證最優(yōu)性, Majid Daliri 表示他已告知全體作者,但在我們要求修正 TurboQuant 論文中的事實(shí)性錯(cuò)誤之后,Majid Daliri 停止回復(fù)

2025年11月:我們發(fā)現(xiàn) TurboQuant 論文被提交至 ICLR 2026 會(huì)議,且論文中的事實(shí)性錯(cuò)誤并未修正,為此我們聯(lián)系了 ICLR 2026 PC Chairs,未獲回應(yīng)

2026年1月:TurboQuant 論文被 ICLR 2026 接收 2026年3月:TurboQuant 團(tuán)隊(duì)通過(guò) Google 官方渠道持續(xù)推廣,社交媒體相關(guān)瀏覽量已達(dá)數(shù)千萬(wàn)次

2026年3月:我們正式向 TurboQuant 全體作者發(fā)送郵件,闡述以上三個(gè)事實(shí)性問(wèn)題并要求做出修正及澄清。截至目前為止,我們僅收到 TurboQuant 論文第一作者 Amir Zandieh 的籠統(tǒng)答復(fù),承諾會(huì)修正問(wèn)題二和問(wèn)題三,但拒絕修正問(wèn)題一(即討論 TurboQuant 與 RaBitQ 在技術(shù)上的相似性)。并且,他們僅愿意在 ICLR 2026 正式會(huì)議結(jié)束之后才做相應(yīng)修正

我們已經(jīng)做了什么

在 ICLR OpenReview 發(fā)布公開(kāi)評(píng)論: https://openreview.net/forum?id=tO3ASKZlok

向 ICLR General Chairs, PC Chairs, Code and Ethnics Chairs 再次提交正式投訴,附完整證據(jù)包

我們接下來(lái)會(huì)做什么

在 arXiv 發(fā)布詳細(xì)的關(guān)于 TurboQuant 和 RaBitQ 的技術(shù)報(bào)告

考慮向相關(guān)機(jī)構(gòu)進(jìn)一步反映

最后

我們提出這些問(wèn)題,目標(biāo)是讓公共學(xué)術(shù)記錄準(zhǔn)確地反映各方法之間的真實(shí)關(guān)系。一篇論文被 Google 以數(shù)千萬(wàn)曝光量推向公眾,在這種體量下,論文中錯(cuò)誤的敘事不需要主動(dòng)傳播,只需要不被糾正,就會(huì)自動(dòng)成為共識(shí),這也是我們選擇公開(kāi)記錄的原因。

在此我們也懇請(qǐng)大家讓更多人知道 TurboQuant 論文背后存在的問(wèn)題,我們相信真理越辯越明。

2.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。