日前,龍芯在發(fā)布會(huì)上發(fā)布了3A3000和一系列產(chǎn)品。而且發(fā)布會(huì)上還公布了龍芯開(kāi)發(fā)者計(jì)劃、龍芯高校計(jì)劃、龍芯產(chǎn)業(yè)基金。不過(guò),筆者本文介紹的是龍芯正在研發(fā)的下一代CPU——3A4000。
龍芯3A4000的設(shè)計(jì)指標(biāo)如何,要實(shí)現(xiàn)這個(gè)指標(biāo)有何難度?龍芯3A4000性能會(huì)有哪些可能性呢?
關(guān)于3A4000的進(jìn)度
關(guān)于龍芯3A4000,龍芯對(duì)其寄予了厚望,特別是吸取了3A2000和3A3000的不足后,做了修改,而且改動(dòng)比較大,龍芯方面最理想的目標(biāo)是實(shí)現(xiàn)GCC編譯器下SPEC06 定點(diǎn)20分,不過(guò)這個(gè)是最理想狀態(tài)下的。畢竟CPU公司跳票或者沒(méi)能達(dá)到計(jì)劃的情況很常見(jiàn),即便是Intel、AMD都有這種黑歷史。
先介紹一下3A4000的進(jìn)度。3A4000的研發(fā)會(huì)比較慢,主要是兩個(gè)目標(biāo)定的很高,一個(gè)是GCC編譯器下,SPEC2006測(cè)試能達(dá)到10/G,另一個(gè)是主頻到2G。
10/G是什么概念呢?AMD的Zen大概也就這個(gè)水平——AMD自己公布的是3.4G,31.5分,換算以下就是9.26/G。不過(guò)由于一些優(yōu)化選項(xiàng)沒(méi)開(kāi),而且編譯器是GCC4.6,換一下GCC編譯器版本,多開(kāi)一些優(yōu)化,10+/G的成績(jī)Zen還是能達(dá)到的。
Intel的Haswell,像賽揚(yáng)的話,因?yàn)闆](méi)有AVX指令帶來(lái)的向量?jī)?yōu)化,以及緩存被“閹割”等因素,也就 9.3/G,而I5 4460因?yàn)椴幌褓悡P(yáng)被“閹割”,可以到11/G,網(wǎng)友測(cè)試Skylake,大約也就11+/G(畢竟Intel這些年在擠牙膏)。
因此,如果龍芯3A4000能到10/G,那在微結(jié)構(gòu)上和Intel、AMD的差距就比較小了。不過(guò),考慮到越往上走,微結(jié)構(gòu)優(yōu)化難度越大。像3A4000基本上是3A3000里一點(diǎn)一點(diǎn)的摳,因而要實(shí)現(xiàn)這一目標(biāo)的難度很大。
難度到底有多大呢?作為參照,以AMD的實(shí)力憋出Zen都用了九牛二虎之力,而龍芯3A3000的微結(jié)構(gòu)GS464E除了帶寬是K10的兩倍之外,總體上GS464E和K10相當(dāng)。等于是龍芯要完成AMD從K10到Zen的跨越。
AMD憋出Zen都用了這么久,龍芯要實(shí)現(xiàn)這一點(diǎn),難度可想而知。
第二是主頻,龍芯3A3000主頻上不去,固然有自身后端設(shè)計(jì)能力相對(duì)有限的因素,但也和人力、財(cái)力,以及和代工廠的能力息息相關(guān)。而境內(nèi)的代工廠在同制程下只有臺(tái)積電的60%,和龍芯長(zhǎng)期合作的ST在同制程下也只有臺(tái)積電的80%,而臺(tái)積電和Intel又有一定差距。
另外,如果主頻要做上去,IC設(shè)計(jì)公司和代工廠就必須建立非常密切的關(guān)系,要開(kāi)放一些技術(shù)資料,像Intel和曾經(jīng)的AMD、IBM都是IDM廠商,因此可以開(kāi)放技術(shù)資料設(shè)計(jì)和工藝制造不斷磨合。雖然IBM和AMD把晶圓廠賣(mài)了,但依舊和GF保持了過(guò)去的密切聯(lián)系,很多技術(shù)儲(chǔ)備和資料也都保留了下來(lái),這樣就可以繼續(xù)做高主頻CPU。但龍芯和ST不可能建立這種關(guān)系。
而境內(nèi)的一些代工廠,在技術(shù)實(shí)力上還有待提高——境內(nèi)工藝的一致性比境外工藝有一定差距,包括不同批次的一致性,仿真模型和實(shí)際晶體管參數(shù)的一致性都和國(guó)外工藝有一定差距,設(shè)計(jì)時(shí)要多留些裕量,蒙特卡羅仿真也要把參數(shù)波動(dòng)范圍設(shè)大一些。
龍芯3A2000在研制中就因?yàn)楹途硟?nèi)代工廠磨合多耗費(fèi)了1年時(shí)間,而在ST流片的3A3000則非常順利了,從立項(xiàng)到流片也就用了1年時(shí)間左右。換言之,就是龍芯即便和境內(nèi)代工廠建立了密切的合作關(guān)系,境內(nèi)代工廠也只能說(shuō):臣妾做不到啊!
此外,微結(jié)構(gòu)越復(fù)雜,后端設(shè)計(jì)壓力就越大,比如像把A53主頻做到2G和把Zen的主頻做到2G完全不是一個(gè)檔次的工作難度。像3A4000這種CPU的微結(jié)構(gòu),設(shè)計(jì)目標(biāo)接近Haswell的東西,對(duì)于任何一家國(guó)內(nèi)團(tuán)隊(duì)來(lái)說(shuō),后端設(shè)計(jì)難度都非常大,而且龍芯3A3000和龍芯3A4000,還是使用同樣的制造工藝,這樣就不可能通過(guò)工藝的提升來(lái)提升主頻,完全靠自身的設(shè)計(jì)能力把主頻提升30%,難度可想而知。
最后,雖然目前微結(jié)構(gòu)優(yōu)化的成果比較喜人,而且已經(jīng)有仿真結(jié)果了。但由于要達(dá)到2G主頻,最后可能會(huì)做一些權(quán)衡。最后能拿出怎么樣的產(chǎn)品,只有等待時(shí)間檢驗(yàn)了。
筆者做一個(gè)預(yù)測(cè),龍芯3A4000可能會(huì)采用ST 28nm FD SOI工藝,如果搶時(shí)間的話,保守估計(jì)主頻1.8-2.0,SPEC06 GCC編譯器下定點(diǎn)16-18分。
如果多花費(fèi)一些時(shí)間進(jìn)行優(yōu)化,而且龍芯團(tuán)隊(duì)發(fā)揮正常的話,3A4000主頻為2G,SPEC06 GCC編譯器下定點(diǎn)18+分。
如果龍芯團(tuán)隊(duì)超水平發(fā)揮,ST也沒(méi)有掉鏈子,也許能實(shí)現(xiàn)GCC編譯器下SPEC06 定點(diǎn)20分。
關(guān)于龍芯走自主道路和發(fā)展方向
必須強(qiáng)調(diào)的是,雖然網(wǎng)絡(luò)上充斥著對(duì)龍芯各種不靠譜的報(bào)道,但龍芯對(duì)自己的能力,與Intel、AMD的差距認(rèn)識(shí)的非常清楚。
在2020年前,龍芯主打方向是工控、網(wǎng)安,以及石油、電力、交通、金融等行業(yè)應(yīng)用,這些行業(yè)應(yīng)用一方面事關(guān)國(guó)家信息安全,另一方面在替換上不像桌面和手機(jī)存在龐雜的軟件生態(tài)的問(wèn)題。
對(duì)于龍芯的PC,3A3000主要針對(duì)的是黨政軍辦公和龍芯愛(ài)好者、開(kāi)發(fā)者。龍芯既沒(méi)有能力,也沒(méi)有心思進(jìn)軍民用市場(chǎng)與Wintel一爭(zhēng)高下。
龍芯的思路是分步走,第一步能自己養(yǎng)活自己,在特殊市場(chǎng)和一些行業(yè)嵌入式應(yīng)用賺錢(qián),能夠養(yǎng)隊(duì)伍,賺來(lái)的錢(qián)能支持龍芯3號(hào)系列芯片的研發(fā)。這方面已經(jīng)取得了不菲的成績(jī),可以說(shuō)龍芯是在幾家有官方背景的IC設(shè)計(jì)公司中獲得政府經(jīng)費(fèi)支持最少的,也是極其罕見(jiàn)的可以實(shí)現(xiàn)政府?dāng)嗄?,自收自支、自?fù)盈虧的。
第二步是特定市場(chǎng),比如黨政軍辦公PC,并鼓勵(lì)開(kāi)發(fā)者、愛(ài)好者使用龍芯電腦。同時(shí)進(jìn)一步開(kāi)拓行業(yè)市場(chǎng),讓更多的行業(yè)和嵌入式設(shè)備使用龍芯,擴(kuò)大自己的根據(jù)地,增加市場(chǎng)份額和營(yíng)業(yè)收入,并逐步建立起產(chǎn)業(yè)聯(lián)盟和特定市場(chǎng)的軟件生態(tài)——比如軟件滿足黨政軍辦公使用,或者滿足對(duì)保密要求比較高的科研單位,或十大軍工的科研院所使用。
第三步才是進(jìn)軍民用市場(chǎng)。到這一步還非常遙遠(yuǎn),有很長(zhǎng)的路要走。龍芯目前,還處于第二步。
龍芯的路之所以會(huì)這么難,因?yàn)槿f(wàn)事靠自己,不可能像合資公司那樣,獲得國(guó)家巨額經(jīng)費(fèi)支持,去境外弄一個(gè)內(nèi)核,然后去用臺(tái)積電最好的工藝做一個(gè)CPU/SoC,也不可能像一些公司買(mǎi)ARM的IP做集成,而且還有現(xiàn)成的AA體系來(lái)支撐商業(yè)化。
龍芯必須自己擴(kuò)展指令集,開(kāi)發(fā)各種IP,自己根據(jù)開(kāi)源軟件改寫(xiě)操作系統(tǒng),自己建產(chǎn)業(yè)聯(lián)盟和軟件生態(tài)。這種做法步子自然是比與境外廠商合作或者合資的來(lái)的慢,但勝在根基扎實(shí),不僅可以實(shí)現(xiàn)自主可控,而且可以掌握設(shè)計(jì)高性能CPU的能力。
而合作/合資,就意味著很多東西境外廠商已經(jīng)幫你做好了,你就撿現(xiàn)成的就行了,而且合資或者合作中,肯定有很多限制條件,老外也不是活雷鋒,會(huì)把技術(shù)傾囊相授。比如汽車(chē)廠在合資中,就有圖紙上一條線,中國(guó)工程師都不能改,要改的話,也必須經(jīng)老外層層上報(bào)由外國(guó)公司決定。這種限制性條款就杜絕了中國(guó)工程師通過(guò)修改原始設(shè)計(jì),逐步吃透國(guó)外技術(shù)的可能性。
長(zhǎng)遠(yuǎn)來(lái)看,采用合資/合作模式,不僅無(wú)法形成獨(dú)立于AA、Wintel的第三級(jí),而且自己的能力發(fā)展就受到了制約。這也是為何幾大車(chē)廠與國(guó)外巨頭合資N多年,但在自主創(chuàng)新上,依舊乏善可陳的原因。