量子霸權(quán)的實現(xiàn),將是量子計算發(fā)展的一座重要里程碑,代表「量子計算的超強計算能力」自 37 年前提出以來首次從理論走進實驗,標志一個新的計算能力飛躍時代的開始。近年來,隨著「實現(xiàn)量子霸權(quán)」的日益臨近,「稱霸標準」成為量子計算領(lǐng)域最重要的科學問題之一。
我國科學家最早開啟了「稱霸標準」問題的研究。最近,《國家科學評論》(National Science Review)以「A Benchmark Test of Boson Sampling on Tianhe-2 Supercomputer」為題正式發(fā)表了國防科技大學吳俊杰團隊與上海交通大學金賢敏教授的合作研究成果,報道了玻色采樣案例的「稱霸標準」。
圖 1:實現(xiàn)玻色采樣的計算任務(wù):(a)天河二號超級計算機計算積和式;(b)光量子系統(tǒng)通過采樣輸出光子直接完成玻色采樣。
量子霸權(quán)
上世紀八十年代,費曼提出量子計算的概念。九十年代,科學家們發(fā)明了一批重要的量子算法,在理論上發(fā)現(xiàn)量子計算擁有經(jīng)典計算無法比擬的超強計算能力。人們開始意識到,量子計算機將是 IT 領(lǐng)域的「屠龍刀」,一旦實現(xiàn)將超越經(jīng)典計算的極限。美國加州理工學院物理學家 John Preskill,將這種超越所有經(jīng)典計算機的計算能力起名「量子霸權(quán)(quantum supremacy)」。
到目前為止,科學家仍未成功打造出能夠展示量子霸權(quán)的實際量子裝置。2010 年,MIT 科學家 Scott Aaronson 提出了可用于展示霸權(quán)的玻色采樣問題。玻色采樣是一種針對光子(玻色子)系統(tǒng)的量子霸權(quán)測試案例。理論上,經(jīng)典計算機求解玻色采樣需要指數(shù)量級計算時間,而量子計算只需要多項式量級計算時間。與此同時,相比通用量子計算,玻色采樣更容易實現(xiàn)。
天河二號
玻色采樣的理論方案一經(jīng)提出,全球科學家紛紛行動起來。2013 年,首批玻色采樣的原理實驗裝置問世,實現(xiàn)了 3-4 個光子的玻色采樣實驗。當時,金賢敏所在的牛津大學研究組,正是國際上最早實現(xiàn)玻色采樣實驗的團隊之一。
2013 年 9 月,國防科技大學的吳俊杰赴牛津訪問,與金賢敏交流起玻色采樣實現(xiàn)量子霸權(quán)所需的功力,發(fā)現(xiàn)科學家還未了解經(jīng)典計算機的真正實力。當時,國防科大研制的天河二號超級計算機是經(jīng)典計算領(lǐng)域的「倚天劍」,剛在超級計算機中奪得頭籌,計算能力排名全球第一。于是,兩人商定要驗驗天河倚天劍到底能劈開多大規(guī)模的玻色采樣問題,為玻色采樣量子屠龍刀立下稱霸標準。
經(jīng)過嚴謹?shù)臏y試與分析,他們的成果于 2016 年 6 月發(fā)表在預(yù)印版網(wǎng)站 arXiv 上。當時,天河二號正六次蟬聯(lián)超級計算機排行榜第一位。論文實際測試的問題規(guī)模達到 48 個光子,并推斷出天河二號完成 50 個光子玻色采樣的最高生成率約為每組樣本 100 分鐘。也就是說,一旦打造出「每組樣本 100 分鐘以內(nèi)的 50 個光子玻色采樣」的量子屠龍刀,就在求解玻色采樣問題上超過了天河倚天劍的功力,實現(xiàn)了量子霸權(quán)。
量子霸權(quán)爭奪戰(zhàn)
值得指出的是,因為并不要求用于展示量子霸權(quán)的問題具有任何實際用途,「實現(xiàn)量子霸權(quán)」相較「實現(xiàn)實際的量子計算機」要簡單許多。而與此同時,「稱霸標準」的研究成果表明,當前實現(xiàn)量子霸權(quán)也絕非易事。英國布里斯托大學、倫敦帝國理工學院、意大利羅馬大學等科學家相繼發(fā)文,引用吳俊杰和金賢敏的成果,論證當前的技術(shù)水平離實現(xiàn)量子霸權(quán)也依然存在不小差距。當前,國際最高水平的玻色采樣量子裝置,是中科大實現(xiàn)的 5 光子實驗。
值得關(guān)注的另一種量子霸權(quán)測試案例,是隨機量子線路采樣問題,國內(nèi)外科學家同樣用超級計算機進行這一問題的稱霸標準測試。2016 年 7 月,Google 科學家在 arXiv 上發(fā)文,測試了 Edison 超級計算機(當時排名世界第 39)求解這一問題的性能;次年 3 月,他們在 Nature 上發(fā)表評論文章,認為 49 個量子比特、深度為 25 的隨機量子線路是這個案例的稱霸標準。這掀起了 Google、IBM 等的「量子霸權(quán)爭奪戰(zhàn)」,爭相展示各自的隨機線路采樣量子屠龍刀雛形。而與此同時,科學家們不斷改進方法,隨機線路采樣問題的稱霸門檻也被不斷提高:IBM 科學家在去年 10 月將稱霸標準提升至 56 個量子比特;今年 2 月,門檻再次被中科大提升至 72 個量子比特。中國科學院院士楊學軍:「高性能計算已經(jīng)成為現(xiàn)代科學技術(shù)研究中必不可少的重要手段。未來,超級計算機將會在量子計算科學與技術(shù)的發(fā)展進步中發(fā)揮更大作用!」
量子計算是物理學、計算機科學、數(shù)學、材料學、光學等眾多學科的前沿交叉方向,研究前路依然充滿艱難險阻!現(xiàn)在,吳俊杰所在的國防科大成立了首個計算機學科的量子信息研究所,金賢敏也已回國在上海交大組建了光子集成與量子信息實驗室。我們相信,在所有科學家的共同努力下,量子計算一定能給我們創(chuàng)造更美好的未來!
論文:A benchmark test of boson sampling on Tianhe-2 supercomputer
論文地址:https://doi.org/10.1093/nsr/nwy079
摘要:一種被認為用經(jīng)典計算難以有效處理的問題——玻色采樣,可以通過量子計算來有效解決。玻色采樣量子計算,僅需要擁有光子生成、線性演化和探測技術(shù)就可以實現(xiàn)。這種解決特定問題的模擬式量子計算機提供了一條捷徑,用來實際展示量子計算機擊敗經(jīng)典計算機的計算能力。然而,經(jīng)典計算機求解玻色采樣的能力上界尚未確定。因此,我們在天河二號超級計算機上模擬了玻色采樣問題,該計算機在 2013-2016 年間六次位居世界第一。我們最大使用了天河二號 312,000 個 CPU 內(nèi)核來計算矩陣的積和式,通過當前最優(yōu)的積和式計算算法,我們推斷出天河二號的性能上界是約每 100 分鐘生成一個 50 光子樣本。此外,我們還發(fā)現(xiàn)了其中一種積和式計算算法的精度問題。
給定一個 m x m 大小的幺正矩陣以及 n 個不可區(qū)分的玻色子(如圖 1b 所示),在經(jīng)典計算機上模擬玻色采樣的過程是從方程 (1) 描述的分布中進行采樣來生成樣本:
式中,S=|s_1,...,s_m>是給定的輸入態(tài),代表 s_i 個玻色子位于第 i 個輸入端,T=|t_1,...,t_m>是輸出態(tài),代表 t_j 個玻色子位于第 j 個輸出端,U_{S,T} 是從 U 導出的 n x n 子矩陣。積和式計算是經(jīng)典計算機模擬玻色采樣過程中最耗時的任務(wù),因為它正是玻色采樣在計算復雜性理論中所表現(xiàn)出困難性的根源。因此,計算這個 n x n 子矩陣 U_{S,T} 的積和式性能是從分布 Pr[S→T] 生成 n-光子采樣的性能的上界。在本文中,我們通過在天河二號上(如圖 1a 所示)測試兩種最高效的積和式計算算法來評估這個上界,結(jié)果表明天河二號需要大約 100 分鐘來生成一個 50 光子的樣本。
這兩種算法分別是 Ryser 算法和 BB/FG 算法,其計算時間復雜度都是 O(n^2·2^n)。
圖 2:可擴展性。(a)和(b)展示了用 P 個節(jié)點來計算一個 n x n 矩陣的積和式的執(zhí)行時間。「@CPU」表示僅在 CPU 上運行獲得的結(jié)果,「@Hybrid」表示在 CPU 和加速器異構(gòu)并行執(zhí)行獲得的結(jié)果。擬合曲線的斜率表明 n 每增加 1,執(zhí)行時間增長約 1.95 倍,而計算節(jié)點每加倍,執(zhí)行時間減少約 0.52-0.56 的比例。(c)是 Ryser 算法用 P 個節(jié)點來計算 n x n 矩陣的積和式的執(zhí)行時間。校正 R 平方統(tǒng)計系數(shù)是 0.9996,表明擬合結(jié)果良好。(d)是 BB/FG 算法的擬合執(zhí)行時間。黑點是使用天河二號全系統(tǒng)來計算 50x50 矩陣的積和式的預(yù)測時間。
由于精度問題,我們使用 BB/FG 而不是 Ryser 算法的擬合執(zhí)行時間數(shù)據(jù),來分析天河二號的性能極限。擬合方程如下:
擬合結(jié)果如圖 2(d)所示,表明使用所有 CPU 和加速器的天河二號全系統(tǒng)計算 50x50 矩陣的積和式執(zhí)行時間大約是 93.8 分鐘,其 95% 置信區(qū)間是 [77.41, 112.44] 分鐘,這意味著天河二號的執(zhí)行時間上界是約每 100 分鐘生成一個 50 光子樣本。
結(jié)語
在本文中,我們推斷了天河二號超級計算機模擬玻色采樣性能的上界。因為天河二號是 2013 年至 2016 年間最快的經(jīng)典計算機,所以這個界限只是針對當時的經(jīng)典計算機。由于硬件進步和軟件優(yōu)化,經(jīng)典計算機的性能也在不斷提高,因此,這一性能上界也會變得越來越高。此外,對兩種算法的精度評估表明,使用經(jīng)典計算機進行實驗驗證時,BB/FG 算法應(yīng)是首選。