通用CPU是IC行業(yè)內(nèi)最具代表性的高集成度產(chǎn)品之一,其研發(fā)難度之高、資源投入之多均屬行業(yè)前列,卻又與信息技術(shù)的發(fā)展息息相關(guān)。2019年6月,兆芯推出的新一代通用CPU KX-6000/KH-30000系列處理器,在采用16nm工藝,將主頻提升到3.0GHz的同時(shí),性能也進(jìn)一步邁入國(guó)際主流水準(zhǔn),為國(guó)產(chǎn)通用CPU的發(fā)展樹立了重要的里程碑。
1
新一代通用CPU的成功發(fā)布與量產(chǎn),128mm Die 面積上集成的20億顆晶體管,凝聚著無(wú)數(shù)的辛勤付出與汗水,作為CPU研發(fā)團(tuán)隊(duì)的負(fù)責(zé)人,兆芯副總經(jīng)理/總工程師王惟林對(duì)國(guó)產(chǎn)通用CPU的發(fā)展與突破,有著更深的體會(huì)。
兆芯副總經(jīng)理/總工程師王惟林工作照
除了周期長(zhǎng)投入大,更重要是尋找平衡
王惟林表示,一顆通用CPU從微架構(gòu)設(shè)計(jì)到最終發(fā)布量產(chǎn),是一個(gè)時(shí)間、人力、物力各方面投入巨大的過(guò)程。在整個(gè)芯片的研發(fā)歷程之中,微架構(gòu)的設(shè)計(jì)開發(fā)占據(jù)著巨大的比重。這項(xiàng)工作的實(shí)施既要考慮到未來(lái)的產(chǎn)品方向、技術(shù)趨勢(shì)以及工藝的變化演進(jìn)等因素,還要結(jié)合對(duì)功能、性能、頻率、功耗等方面的預(yù)期進(jìn)行綜合的考慮,在這些需求中間尋找到一個(gè)最佳的平衡點(diǎn)?!氨热缯f(shuō),在某些單項(xiàng)參數(shù)方面,我們已經(jīng)可以做到比現(xiàn)有數(shù)值好很多。但是考慮到最終客戶的需求、產(chǎn)品的穩(wěn)定性、應(yīng)用場(chǎng)景的功耗控制等,通常都會(huì)做一些取舍?!?/p>
國(guó)產(chǎn)處理器研發(fā)歷程
微架構(gòu)確定之后會(huì)進(jìn)入到具體的設(shè)計(jì)階段,在這一階段,一方面要根據(jù)目標(biāo)市場(chǎng),進(jìn)行更詳細(xì)、更密集的性能、頻率、功耗等方面不斷驗(yàn)證、優(yōu)化,另一方面基于未來(lái)IO的標(biāo)準(zhǔn)、規(guī)格,進(jìn)行芯片組功能的設(shè)計(jì)研發(fā),特別是IP的研發(fā)測(cè)試也極為消耗時(shí)間和精力?!罢麄€(gè)產(chǎn)品設(shè)計(jì)階段,需要經(jīng)歷數(shù)次RTL代碼、時(shí)序等方面的優(yōu)化,以及從電路級(jí)、到模塊級(jí)、芯片級(jí),乃至系統(tǒng)級(jí)的驗(yàn)證測(cè)試,而這些還不包括芯片流片之后的功能、性能、適配、良率等方面的更進(jìn)一步測(cè)試和優(yōu)化工作,”王惟林在說(shuō)起這些需要日復(fù)一日重復(fù)進(jìn)行的設(shè)計(jì)工作時(shí)語(yǔ)氣凝重,依然有沉沉的責(zé)任感。
此外,CPU的設(shè)計(jì)研發(fā)工作中,設(shè)計(jì)方法的研究也是非常重要的組成,每一代工藝對(duì)應(yīng)的設(shè)計(jì)實(shí)現(xiàn)的方法都在不斷演進(jìn),高性能CPU的設(shè)計(jì)方法也需要不斷提升,這樣才能夠基于目標(biāo)工藝,讓最終的產(chǎn)品在頻率和功耗等方面達(dá)到最優(yōu)。
互聯(lián)改進(jìn)、頻率提升、自主IP,新一代通用CPU三大突破得之不易
兆芯新一代通用CPU KX-6000/KH-30000系列處理器有三項(xiàng)技術(shù)突破的過(guò)程令王惟林印象尤為深刻,一是片內(nèi)、片間互聯(lián)的改進(jìn),二是頻率的提升,三是DRAMC DDR4 3200控制器自主IP的成功開發(fā)。
ZPI(Zhaoxin Processor Interconnect)是兆芯自主開發(fā)的全新片間互連技術(shù)
片內(nèi)互聯(lián)方面,兆芯的研發(fā)團(tuán)隊(duì)基于上一代KX-5000系列處理器片內(nèi)互聯(lián)帶寬、傳輸效率、內(nèi)部延遲等方面存在的問(wèn)題,通過(guò)建立多種軟件仿真模型進(jìn)行了大量的測(cè)試和優(yōu)化。片間互聯(lián)ZPI 2.0是兆芯自主設(shè)計(jì)的一套方案?!盎ヂ?lián)架構(gòu)的設(shè)計(jì)研發(fā)以及測(cè)試驗(yàn)證,這些工作大約占據(jù)了整個(gè)芯片研發(fā)工作四分之一的比重。”在整個(gè)互聯(lián)協(xié)議、內(nèi)核間數(shù)據(jù)一致性上,研發(fā)團(tuán)隊(duì)需要進(jìn)行大量的、非常復(fù)雜的測(cè)試和研究。
至于用戶最關(guān)注的主頻提升,王惟林表示,從上一代產(chǎn)品的2.0GHz提升到KX-6000/KH-30000系列處理器的3.0GHz,除了對(duì)流水線的優(yōu)化、物理實(shí)現(xiàn)的優(yōu)化,設(shè)計(jì)過(guò)程中也遇到了很多的問(wèn)題。
“處理器頻率和設(shè)計(jì)規(guī)模的不斷提升,高速和高密,高功耗會(huì)使系統(tǒng)內(nèi)的環(huán)境更加惡劣。電磁環(huán)境的干擾和系統(tǒng)內(nèi)部的相互竄擾,嚴(yán)重地威脅著處理器的穩(wěn)定性、可靠性和安全性。最典型的就比如PI(電源完整性)、SI(信號(hào)完整性)在3.0GHz下的抖動(dòng)和損失,為了解決這個(gè)問(wèn)題,整個(gè)團(tuán)隊(duì)在后端、微架構(gòu)、電路、邏輯設(shè)計(jì)等方面都進(jìn)行了特別的處理,并開發(fā)了新的功能,比如頻率根據(jù)電學(xué)抖動(dòng)自適應(yīng)等?!?/p>
新一代通用CPU中還集成了很多兆芯自主研發(fā)的IP,其中 DRAMC DDR4 控制器支持3200MHz,達(dá)到了行業(yè)的主流標(biāo)準(zhǔn)。從上一代2400MHz到3200MHz,頻率的提升同樣帶來(lái)了SI方面的很多問(wèn)題,針對(duì)這些問(wèn)題,相關(guān)的設(shè)計(jì)團(tuán)隊(duì)在IP設(shè)計(jì)、電路和PCB板設(shè)計(jì)方面也都花費(fèi)了巨大的精力來(lái)改進(jìn)優(yōu)化,直到最終各項(xiàng)指標(biāo)達(dá)到預(yù)期。
兆芯新一代處理器集成的IP(部分)
正視差距,上緊發(fā)條,全力追趕
肯定成績(jī)也要正視差距,談及未來(lái)發(fā)展,王惟林信心滿滿
就國(guó)內(nèi)而言,兆芯新一代通用處理器在頻率、性能、IO標(biāo)準(zhǔn)等方面均處于前列,但放到國(guó)際上看,依然存在很大的差距。在談及國(guó)產(chǎn)通用CPU與國(guó)際同類產(chǎn)品的差距時(shí),王惟林表示,我們也知道差距所在和努力的方向,但由于人力、時(shí)間、資金等外部因素的影響,讓兆芯在芯片研發(fā)過(guò)程中,只能一次性的解決一些問(wèn)題,并且很難有試錯(cuò)的機(jī)會(huì),沒(méi)有辦法精雕細(xì)琢和深入研究,只能盡全力一點(diǎn)點(diǎn)追趕上去?!胺椒ê土鞒?,如同材料學(xué)和飛機(jī)發(fā)動(dòng)機(jī)一樣,需要大量的試錯(cuò)和基礎(chǔ)預(yù)研。但是兆芯一直處于趕路狀態(tài),要確保每一顆芯片成功,很多現(xiàn)實(shí)壓力讓你沒(méi)有時(shí)間也沒(méi)辦法進(jìn)行試錯(cuò),找出某些關(guān)鍵問(wèn)題的更優(yōu)解?!?/p>
“與國(guó)際廠商相比,我們?cè)谘邪l(fā)投入、人力資源方面都遠(yuǎn)遠(yuǎn)不足,但依舊要保持正常的研發(fā)周期,團(tuán)隊(duì)所要付出的時(shí)間成本就更加顯著,唯有給自己擰緊“發(fā)條”,加班加點(diǎn)自然也就變得稀松平常,再然后也成了一種習(xí)慣,”王惟林說(shuō)。
關(guān)于接下來(lái)的工作重心,王惟林表示,兆芯目前正在積極準(zhǔn)備下一代的產(chǎn)品,希望在微架構(gòu)方面能取得更大的突破,“在KX-6000/KH-30000系列處理器的基礎(chǔ)上,單核性能得到顯著的提升,同時(shí)進(jìn)一步優(yōu)化片內(nèi)、片間互聯(lián)的性能,并且在內(nèi)存、IO規(guī)格支持上達(dá)到國(guó)際同期主流水準(zhǔn),力求打造出一款更好用的電腦芯,在滿足用戶需求的同時(shí),加速縮短與國(guó)際領(lǐng)先水平的差距,“談及未來(lái)目標(biāo),王惟林信心滿滿。