123,123,123

中国超算芯片是怎样一步步追上英特尔的

日期： 2016-02-01

關(guān)鍵詞： 超级计算机至强 Intel 天河2号

2015年4月，美國商務(wù)部決定對中國四家國家超級計算機中心禁售至強PHI計算卡，當(dāng)時各種唱衰中國超算的聲音不絕于耳。即便天河2號在2015年國際超級計算機大會上蟬聯(lián)5連冠，但因使用美國 Intel公司的CPU而飽受一些別有用心之人的詬病，不少人聲稱沒有美國的CPU，天河2號要完蛋了。

　　現(xiàn)實卻截然相反：

　　在ISC2015發(fā)布會上，國防科大公布天河2A的升級方案，將采用國防科大自主研發(fā)的矩陣2000(GPDSP)替代至強PHI計算卡。矩陣2000采用40nm制程，擁有16核，主頻1G，雙精浮點2.4TFlops，功耗為200W。

　　新年伊始，從科技部公開的文章中透露出好消息——由上海高性能集成電路設(shè)計中心設(shè)計的國產(chǎn)眾核芯片已達到世界先進水平(美國情報部門對該芯片非常感興趣，因此筆者將其稱為國產(chǎn)眾核芯片)。該眾核芯片采用28nm制程，峰值雙精度浮點運算速度超過每秒3萬億次(3TFlops)，完全追平了 Intel第二代XeonPhi(也是Intel最好的眾核芯片)——第二代至強PHI計算卡產(chǎn)品代號“KnightsLanding”，采用了14nm 工藝，雙精度浮點性能超過3TFlops，功耗250-300W。

　　1月22日，新華社報道了一則更為振奮人心的消息——中國計劃今年在天津啟動新一代百億億次(百億億次是1000P，天河2號為55P，若不是記者筆誤，就真心是黑科技了)超級計算機的研制規(guī)劃......與此同時，國防科大正在設(shè)計新一代飛騰芯片。

　　由此可見，美國商務(wù)部的禁售計算卡的行為根本沒有對中國超算發(fā)展起到多大制約作用。其實，在過去半個世紀的時間里，歷史已經(jīng)證明了毛澤東同志的那句話——“封鎖吧，封鎖十年八年，中國的問題就解決了”。

　　凡是能買到的都很難做出來

　　雖然自80年代以來，中國的計算機大多沒有中國芯，即便是天河1號、天河2號這些曾經(jīng)讓中國人揚眉吐氣的超級計算機也基本使用國外芯片，國產(chǎn)芯片僅用于高速互聯(lián)網(wǎng)絡(luò)。

　　但在毛澤東時代，中國擁有自己的半導(dǎo)體工業(yè)，掌握了從單晶制備、設(shè)備制造、集成電路制造的全過程技術(shù)，中國制造的計算機也都有中國芯。

　　但在80年代奉行“造不如買、買不如租”、“市場換技術(shù)”后，中國集成電路產(chǎn)業(yè)遭到毀滅性的打擊——毛澤東時代積累下的家底被敗得精光，技術(shù)人才要么流失到國外，要么去大學(xué)教書，有的甚至被調(diào)去看守機房，毛澤東時代培養(yǎng)起來的技術(shù)人才流失殆盡。

　　在這段時間里，自主技術(shù)被無限貶低，而洋技術(shù)被過度美化，“外國專家”更是被奉為上帝，決策者對其缺乏最基本的警惕——很多非常有前途的科研項目在領(lǐng)導(dǎo)聽取“外國專家”的意見后被否決;不少科研項目更是在“外國專家”的“悉心指導(dǎo)”下被引上了歧路;對“外國專家”索要技術(shù)資料予取予求，大量寶貴的自主技術(shù)被“外國專家”竊取后搖身一變成為“洋技術(shù)”，釀成中國企業(yè)使用自己研發(fā)的技術(shù)依舊要給外商繳納專利費的窘境。

　　而自主研發(fā)CPU也被進口CPU取代，比如1983年，浪潮開始采用進口Intel8088芯片，而非國產(chǎn)芯片組裝0520微機，在80年代至 90年代初研制的長城286、長城386、長城486、2780機、太極2220、銀河超級小型機、HN2730超級小型機等計算機均采用國外芯片。中國第四代計算機中的巨型機代表機型——“銀河1”巨型計算機耗資1億元人民幣，但因大量購買國外硬件，未能對中國的半導(dǎo)體產(chǎn)業(yè)進步起到多大積極作用。

　　在“造不如買、買不如租”理論的指導(dǎo)下，至80年代末，中國憑自己的技術(shù)已經(jīng)很難生產(chǎn)出一臺計算機了。到90年代初，以聯(lián)想為代表的中國計算機企業(yè)紛紛轉(zhuǎn)向“貿(mào)工技”路線，只從事低附加值的微機組裝，無力也無心從事芯片研發(fā)，國內(nèi)芯片市場徹底落入外資掌控。

　　凡是買不到的都做出來了

　　中蘇論戰(zhàn)后，美蘇同時對中國進行技術(shù)封鎖，迫使中國走上獨立自主、自力更生的發(fā)展道路。正如赫魯曉夫撤走了蘇聯(lián)援華專家后，逼著中國憑借自己的能力搞出了“兩彈一星”。在美國和蘇聯(lián)共同技術(shù)封鎖下，哈軍工于1962年成功研發(fā)出晶體管，使中國比美國晚8年進入晶體管時代，中國第一臺全晶體管計算機441B-I于1964年誕生，相對于美國于第一臺全晶體管計算機RCA501晚了6年。1965年，中國研制出第一塊集成電路，比美國晚了5年進入集成電路時代。1972年，中國研制出大規(guī)模集成電路比美國晚4年實現(xiàn)了從中小集成電路發(fā)展到大規(guī)模集成電路的跨越。

　　在中國喪失獨立自主研發(fā)制造計算機的能力后，美國政府嚴格限制對中國出口高性能計算機，除了采購價格高昂外，還要把計算機放在透明的玻璃房中，由美國人監(jiān)控，鑰匙在美國人手中，每次使用都要向美國人請示，并說明具體用途，由美國人核準使用。

　　痛定思痛后，中國重啟高性能計算機研發(fā)項目，1992年銀河2誕生。1993年，曙光1號誕生，曙光1號研制成功后3天，西方解除對中國高性能計算機出口限制。在堅定了自主發(fā)展超算的決心后，中國超算捷報頻傳——先后自主研發(fā)曙光1000、曙光2000、曙光3000、曙光4000、曙光 5000、曙光6000、銀河3、銀河4、天河1號、天河2號、神威藍光等超算，并逐步形成了天河(國防科大)、神威、曙光(曙光公司)三大系列超算。

　　與此同時，國產(chǎn)超算的軟件系統(tǒng)和硬件系統(tǒng)的國產(chǎn)化也在穩(wěn)步推進——天河2號的硬件系統(tǒng)除了高速運算系統(tǒng)中采用了Intel的E5和至強PHI之外，高速互連通信網(wǎng)絡(luò)系統(tǒng)、存儲系統(tǒng)(I/O管理結(jié)點和I/O存儲結(jié)點)、維護監(jiān)控系統(tǒng)、電源系統(tǒng)、冷卻系統(tǒng)和結(jié)構(gòu)組裝設(shè)計等基本實現(xiàn)國產(chǎn)化，在軟件系統(tǒng) 方面，操作系統(tǒng)、編譯系統(tǒng)、并行程序開發(fā)環(huán)境、科學(xué)計算可視化系統(tǒng)大多實現(xiàn)國產(chǎn)化。而神威藍光超算則實現(xiàn)了除冷卻系統(tǒng)之外的軟件和硬件的全國產(chǎn)。

　　更為重要的是，這些超算并非像某些人說的為爭奪世界第一的虛名建設(shè)，而是實實在在的用于彈道計算、核物理研究、氣候氣象、海洋環(huán)境、數(shù)值風(fēng)洞、碰撞仿真、生命科學(xué)、石油物探等科研領(lǐng)域。另外，國產(chǎn)超算/高性能計算機還廣泛用于工業(yè)生產(chǎn)、氣象預(yù)報和影視娛樂。

　　曙光公司的高性能計算機在中石油、中石化和中海油勘探計算機房內(nèi)隨處可見，這些高性能計算機為工程師提供高精度的采油區(qū)地下構(gòu)造和地質(zhì)信息。

　　“天河-酷卡”云計算渲染平臺使動畫渲染的制作周期由原來的4至6個月縮短到1天，平均每天同時為8部動漫影視作品提供渲染?！栋⒎策_》動漫渲染制作耗時1年多完成，如果用“天河二號”，則僅需1個月時間。

　　隨著霧霾現(xiàn)象越來越受人民關(guān)注，霧霾天氣預(yù)警預(yù)報已經(jīng)成為“天河一號”的又一項任務(wù)。國家超算天津中心已經(jīng)研發(fā)出霧霾自動化實時預(yù)警預(yù)報系統(tǒng)，正以河北保定作為試點，對未來5天霧霾天實時預(yù)報，未來3年內(nèi)逐步建成全國性的霧霾預(yù)警預(yù)報系統(tǒng)。此外，天河超算還能回溯地球的氣候變遷，“天河一號”可以模擬2000年前的變化，“天河二號”則可以模擬到5000年前甚至更遠。

　　中科曙光與大氣物理所等單位共同研發(fā)“地球數(shù)值模擬裝置”原型機系統(tǒng)，則填補了我國地球系統(tǒng)模式大數(shù)據(jù)實踐平臺的空白。

　　可以說，超級計算機為中國的國防、科研、工業(yè)、經(jīng)濟等諸多方面做出了巨大貢獻!

　　以史為鑒，技術(shù)封鎖其實是件好事，在信息技術(shù)領(lǐng)域，建國以來的這段歷史就可說明“凡是能買到的都很難做出來了，凡是買不到的都做出來了”。因為只要西方技術(shù)封鎖，國內(nèi)買辦和國外勢力就不可能用“市場換技術(shù)”、“造不如買、買不如租”的方式來扼殺自主技術(shù)。

　　那么，中國的人力物力財力將全部投入到自主技術(shù)的研發(fā)中，輔以中國全世界最齊全的工業(yè)部門和扎實的工業(yè)基礎(chǔ)，加上中國龐大的市場和豐富的資源，就能做到“封鎖什么，解決什么”，所以從長期來看，技術(shù)封鎖是好事。

　　中美眾核芯片對比

　　在幾年前，當(dāng)Intel第一代至強PHI上市之時，國內(nèi)根本就沒有類似的產(chǎn)品，而龍芯、申威、飛騰準備用于超算的多核芯片也遠遠無法與Intel匹敵：

　　飛騰1500，16核，制程40nm，1.8G主頻，最大功耗65W，雙精浮點144G;

　　申威1600，16核，制程65nm，1.1G主頻，最大功耗70W，雙精浮點140G;

　　申威1610，16核，制程40nm，1.6G主頻，最大功耗50W，雙精浮點200G;

　　龍芯3B1000，8核，制程65nm，1G主頻，最大功耗65W，雙精浮點128G;

　　龍芯3B1500，8核，制程32nm，1.2G主頻，最大功耗40W，雙精浮點192G。

　　即便是成績最好的申威1610的理論雙精浮點峰值也只有200G，而Intel第一代至強PHI的理論雙精浮點峰值高達1T，是申威1610的5倍。正是因此，天河2號只能無奈的選擇Intel至強PHI作為其加速器。

　　光陰似箭，時過境遷，經(jīng)過數(shù)年的臥薪嘗膽，國內(nèi)IC設(shè)計單位的實力與日俱增，不僅能拿出至強PHI計算卡的替代產(chǎn)品，而且在性能上絲毫不落下風(fēng)。國防科大自主研發(fā)的矩陣2000理論雙精浮點峰值達2.4T，功耗為200W，理論雙精浮點峰值達到第二代至強PHI的80%，性能功耗比略優(yōu)于第二代至強PHI。

　　如果說矩陣2000是GSDSP，而非眾核加速器，在性能上也稍遜第二代至強PHI一籌，那么上海高性能集成電路設(shè)計中心設(shè)計的國產(chǎn)眾核芯片是對美國禁售至強PHI計算卡最有力的回擊，特別是在設(shè)計理念上，國產(chǎn)眾核加速器非常先進。

　　因采用異構(gòu)計算可以獲得更好的性能功耗比和峰值性能，目前中美正在建設(shè)的100P超算基本采用異構(gòu)計算，也就是一個計算節(jié)點由CPU+加速器組成，比如天河2A號一個計算節(jié)點由2個E5(將來可能會替換成國防科大自主研發(fā)的64核服務(wù)器芯片“火星”)和三個矩陣2000組成。加速器可以是K80 這樣的GPGPU，也可以是矩陣2000這樣的GPDSP，還可以是Intel至強PHI、國產(chǎn)眾核芯片這樣的眾核加速器。

　　異構(gòu)計算雖然有很多優(yōu)點，但也會帶來很多缺點，比如通用性不夠好，效率不夠高，編程比較麻煩，另外，天河2號和美國超算Stampede中的 Intel至強PHI計算卡和E5是不共享內(nèi)存的，因而需要程序員顯式拷貝，進而造成性能損失。而國產(chǎn)眾核芯片通過設(shè)計理念的革新，很大程度減輕了上述方面的負面影響，在某些方面甚至徹底避免了性能損失。

　　因此，筆者認為，國產(chǎn)眾核芯雖然因采用28nm制程，使其在制程上遜色于第二代至強PHI的14nm。但憑借設(shè)計理念的先進性，相對于 Intel第二代至強PHI會有一定優(yōu)勢。而雙精浮點運算峰值高達3T的性能指標，使其成為完全不遜色于Intel第二代至強PHI的存在。

　　在中國芯片制造水平不斷提升，并有望不斷縮短和美國芯片制造水平的情況下，如果Intel不能在超算芯片的設(shè)計理念上有革命性的改進，那么被國產(chǎn)眾核芯片的下一代產(chǎn)品超越只是時間問題。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

中国超算芯片是怎样一步步追上英特尔的

日期： 2016-02-01

相關(guān)內(nèi)容