《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > EDA與制造 > 業(yè)界動(dòng)態(tài) > 關(guān)于芯片產(chǎn)業(yè)的未來,專家是這樣看的!

關(guān)于芯片產(chǎn)業(yè)的未來,專家是這樣看的!

2019-08-11
關(guān)鍵詞: 芯片產(chǎn)業(yè)

  2019年度國(guó)際計(jì)算機(jī)體系結(jié)構(gòu)旗艦會(huì)議ISCA于6月在美國(guó)亞利桑那州鳳凰城召開。6月23日與ISCA一起舉行的遠(yuǎn)景研討會(huì)(SIGARCH Visioning Workshop)吸引了上百位聽眾。一方面是因?yàn)榇舜窝杏憰?huì)主題“面向下一代計(jì)算的敏捷開放硬件(Agile and Open Hardware for Next-Generation Computing)”是當(dāng)前體系結(jié)構(gòu)研究領(lǐng)域的前沿?zé)狳c(diǎn),引起了很多人的關(guān)注;另一方面11位報(bào)告人中大牛云集,有圖靈獎(jiǎng)得主David Patterson教授,也有多位美國(guó)工程院院士加持,還有來自MIT、Berkeley、Stanford、UCSD、Google、Nvidia、DARPA等頂尖大學(xué)、企業(yè)和政府機(jī)構(gòu)的專家(自己成了唯一的一位來自美國(guó)以外的報(bào)告人,多少有些勢(shì)單力?。?。

  全程聽完了一天的報(bào)告,我的最大感觸是開源硬件(芯片)在美國(guó)各界已經(jīng)成為一種共識(shí)——從學(xué)術(shù)界、企業(yè)界到DARPA這樣的政府機(jī)構(gòu),都在積極投入到開源芯片與芯片敏捷開發(fā)方向的研究中。早在2016年的首屆Architecture 2030遠(yuǎn)景研討會(huì)上,很多人就認(rèn)為開源硬件將會(huì)是未來的大主題(Big Theme,如圖1)。而在國(guó)內(nèi),很多人對(duì)開源硬件/芯片的理解還有些片面,只是認(rèn)為“開源芯片=RISC-V”。

微信圖片_20190811222453.jpg

  圖1. 2016年遠(yuǎn)景研討會(huì)上開源硬件便備受關(guān)注

  遠(yuǎn)景研討會(huì)(Visioning Workshop)

  ACM體系結(jié)構(gòu)專業(yè)委員會(huì)SIGARCH組織的遠(yuǎn)景研討會(huì)(Visioning Workshop)是一個(gè)暢想未來的學(xué)術(shù)研討會(huì)。第一屆在2016年的ISCA上舉辦,當(dāng)年的主題是《Architecture 2030》,知名華人學(xué)者UCSB的謝源教授受邀做了題為《Technology-driven Architecture Innovation: Challenges and Opportunities》的報(bào)告。第二屆是在多倫多舉辦的ISCA上,主題為《Trends in Machine Learning》,圖靈獎(jiǎng)得主 Yoshua Bengio 教授以及陳天奇、賈揚(yáng)清兩位博士均為受邀報(bào)告人。

  今年是第三屆,主題是“Agile and Open Hardware for Next-Generation Computing”,一共有11個(gè)報(bào)告,以下是議程。

  David Patterson, UC Berkeley/Google, A New Golden Age for Computer Architecture

  Vivienne Sze, MIT, Domain-Specific Architectures for AI and Robotics: Opportunities and Challenges

  Serge Leef, DARPA, Automatic Implementation of Secure Silicon

  Andrew Kahng, UCSD, Bringing Design Technology and Architecture Closer Together: What Open Source Might Enable

  Yungang Bao, Chinese Academy of Sciences, The Four Steps to An Open-Source Chip Design Ecosystem

  Richard Ho, Google, Building A Sustainable Open-Source Hardware Ecosystem

  Mark Horowitz, Stanford, AHA! – Agile HArdware

  Jason Cong, UCLA, Democratize Customizable Computing

  Brucek Khailany, NVIDIA, Machine-Learning-Assisted Agile VLSI Design for Machine Learning

  Borivoje Nikoli?, UC Berkeley, Generating the Next Wave of Custom Chips

  Adam Chlipala, MIT, Strong Formal Verification Across a Hardware-Software Stack with RISC-V

微信圖片_20190811222447.jpg

  圖3. 2019年遠(yuǎn)景研討會(huì)11位報(bào)告人

  報(bào)告1:圖靈獎(jiǎng)得主David Patterson教授眼中的體系結(jié)構(gòu)黃金時(shí)代

  Patterson教授介紹敏捷與開放體系結(jié)構(gòu)的挑戰(zhàn)與機(jī)遇。其實(shí)他的報(bào)告在很多場(chǎng)合都有講過,其中他對(duì)處理器指令集標(biāo)準(zhǔn)與架構(gòu)設(shè)計(jì)的分類值得專門再提一下。

  首先,他向大家強(qiáng)調(diào)ISA指令集、微結(jié)構(gòu)設(shè)計(jì)、產(chǎn)品是三個(gè)層次。如圖4,ISA是規(guī)范標(biāo)準(zhǔn),往往用一本書甚至幾張紙來記錄描述;微結(jié)構(gòu)設(shè)計(jì)是具體實(shí)現(xiàn),對(duì)應(yīng)的是源代碼;產(chǎn)品則是設(shè)計(jì)的實(shí)例化,比如RedHat推出的Linux發(fā)行版。他進(jìn)一步將指令集標(biāo)準(zhǔn)與架構(gòu)設(shè)計(jì)都分為三類:開放免費(fèi)(open & free)、可授權(quán)(Licensiable)、封閉(closed)。于是,我們可以看到,Intel就屬于封閉指令集+封閉設(shè)計(jì),ARM屬于可授權(quán)指令集+可授權(quán)設(shè)計(jì),但要獲得授權(quán)價(jià)格不菲,往往需要上百萬甚至數(shù)千萬美元。

  RISC-V為全世界提供了開放免費(fèi)指令集+開放免費(fèi)設(shè)計(jì)的選擇。根據(jù)圖5的第一行,我們可以知道只有先有了開源開放的指令集,才有可能有開源開放的微架構(gòu)設(shè)計(jì),即綠色格子。需要強(qiáng)調(diào)的是RISC-V本身是一種標(biāo)準(zhǔn)規(guī)范,和C/C++語言規(guī)范、POSIX系統(tǒng)調(diào)用等這些標(biāo)準(zhǔn)是一樣的。本身是開放的,誰都可以基于這些標(biāo)準(zhǔn)來實(shí)現(xiàn)自己的處理器。但有一點(diǎn)需要厘清的是即使都是基于開源開放指令集(比如RISC-V),也存在三種不同的商業(yè)模式:(1)Google、NVidia等企業(yè)在內(nèi)部大量使用RISC-V核作為MCU,但他們不對(duì)外開放IP以及源代碼,這就屬于第一行的紅色格子;(2)SiFive公司、中國(guó)臺(tái)灣晶心Andes、阿里平頭哥的RISC-V核是可以被授權(quán)給第三方使用,但并不開源RTL級(jí)源碼,因此屬于橙色格子;(3)Berkeley的Rocket Chip、劍橋大學(xué)的LowRISC、蜂鳥E203等RISC-V核將RTL級(jí)源碼也開源,這些設(shè)計(jì)可歸到綠色格子。

  圖4.ISA指令集、微結(jié)構(gòu)設(shè)計(jì)、產(chǎn)品三個(gè)層次以及對(duì)應(yīng)的三種商業(yè)模式

微信圖片_20190811222444.jpg

  圖5. 三種不同商業(yè)模式形成處理器分類

  從圖5第一行可知,開放開源指令集并不等于就有了開源的微結(jié)構(gòu)設(shè)計(jì),這兩者很容易被混為一談。很多人也誤判RISC-V受到DARPA資助會(huì)影響其開放性。事實(shí)上,TCP/IP協(xié)議也是DARPA資助下形成的互連標(biāo)準(zhǔn),但在具體實(shí)現(xiàn)層面也可以有不同商業(yè)模式:(1)在網(wǎng)絡(luò)協(xié)議棧的軟件實(shí)現(xiàn)方面,有集成到BSD/Linux中的開源TCP/IP協(xié)議棧,也有微軟實(shí)現(xiàn)集成到商用Windows的TCP/IP協(xié)議棧;(2)在硬件實(shí)現(xiàn)方面上,美國(guó)思科公司可以研發(fā)支持IP協(xié)議的路由器,中國(guó)華為公司也可以研制自己支持IP協(xié)議的路由器,并不會(huì)因?yàn)槭荰CP/IP協(xié)議是受DARPA支持而不能使用。

  另一個(gè)典型的例子是龍芯。龍芯是基于MIPS指令集發(fā)展起來的,而MIPS最早是由美國(guó)企業(yè)開發(fā)和維護(hù)的,但人們都認(rèn)為龍芯是自主設(shè)計(jì)開發(fā)的,這正是區(qū)分了標(biāo)準(zhǔn)規(guī)范和微架構(gòu)設(shè)計(jì)。但談到RISC-V時(shí),大家又經(jīng)常混為一談,實(shí)不應(yīng)該。

  報(bào)告2:面向AI和機(jī)器人的加速器設(shè)計(jì)

  MIT的Vivienne Sze教授介紹了面向AI、機(jī)器人和視頻壓縮的加速器設(shè)計(jì)。如圖6所示,Sze教授認(rèn)為領(lǐng)域?qū)S眉铀倨髟O(shè)計(jì)的套路是:(1)挖掘應(yīng)用特征——利用專用硬件來將并行性、數(shù)據(jù)訪問特征等特征轉(zhuǎn)變?yōu)橥掏屡c能效;(2)設(shè)計(jì)更高效負(fù)載——在不影響結(jié)果質(zhì)量的前提下,通過算法與硬件協(xié)同設(shè)計(jì)更高效的負(fù)載;(3)定義應(yīng)用范圍——根據(jù)應(yīng)用需求平衡靈活性與效率。

  Sze教授用了三個(gè)例子分別展示這個(gè)套路的有效性,即DNN、機(jī)器人自動(dòng)導(dǎo)航、視頻壓縮。圖7是一個(gè)DNN的例子,其他兩個(gè)例子可以直接看她的PPT材料。

  Sze教授近年來獲得了各種獎(jiǎng)項(xiàng),今年ISCA上她的學(xué)生也獲得了最佳博士論文獎(jiǎng)。個(gè)人覺得他們團(tuán)隊(duì)的工作屬于穩(wěn)扎穩(wěn)打型,他們的設(shè)計(jì)中采用的技術(shù)方案都是意料之中,并沒有特別的亮眼的地方。但是他們的工作做得非常扎實(shí),每一項(xiàng)工作都會(huì)把芯片做出來(如圖8),讓人很佩服。相比之下很多其他團(tuán)隊(duì)的工作更多只是停留在論文階段的漂亮設(shè)計(jì)。

  題外話:Sze教授的研究工作風(fēng)格讓我想起中科院動(dòng)物所所長(zhǎng)周琪院士的團(tuán)隊(duì)。周所在報(bào)告時(shí)提到他的學(xué)生曾抱怨,“我們發(fā)表一篇文章數(shù)據(jù)量是其他團(tuán)隊(duì)的10倍,有這個(gè)必要嗎?”他的回答是:“你以后會(huì)認(rèn)識(shí)到,發(fā)表文章不是最難的,最難的是文章發(fā)表了要把它撤回來”。世界頂尖團(tuán)隊(duì)的研究風(fēng)格都是類似的。

微信圖片_20190811222443.jpg

  圖6. 硬件加速器設(shè)計(jì)三部曲

微信圖片_20190811222437.jpg

  圖7. 采用三部曲設(shè)計(jì)方法的DNN加速器案例

微信圖片_20190811222435.jpg

  圖8. MIT Sze教授團(tuán)隊(duì)設(shè)計(jì)與實(shí)現(xiàn)的系列芯片

  報(bào)告3:來自DARPA的視角

  DARPA一直是顛覆式創(chuàng)新的代表,它孕育了很多對(duì)人類產(chǎn)生巨大影響的項(xiàng)目,比如Internet、GPS等。在半導(dǎo)體領(lǐng)域,MPW模式/Fabless模式都是在DARPA資助的項(xiàng)目中孕育出來的。因此DARPA的視角也值得關(guān)注。

  這次報(bào)告的是項(xiàng)目主管Serge Leef,他之前一直在工業(yè)界,已經(jīng)有豐富的芯片領(lǐng)域經(jīng)驗(yàn)。他的報(bào)告介紹了如何自動(dòng)化實(shí)現(xiàn)芯片安全。除了傳統(tǒng)大家知道的芯片架構(gòu)安全,他還專門強(qiáng)調(diào)了供應(yīng)鏈安全,這也反映了美國(guó)在對(duì)華為禁運(yùn)的同時(shí),其實(shí)也在擔(dān)心有一天禁運(yùn)的板子打到自己身上。

  這個(gè)報(bào)告并沒有包含具體的技術(shù),但給人印象深刻的是Serge從整個(gè)業(yè)界生態(tài)角度來分析技術(shù)的價(jià)值——他提到降低芯片設(shè)計(jì)門檻不僅僅是一個(gè)技術(shù)問題,也將促進(jìn)風(fēng)投和創(chuàng)業(yè),從而推動(dòng)行業(yè)的創(chuàng)新(圖9與圖10)。對(duì)于這一點(diǎn)我深表贊同,自己也曾寫過一篇從經(jīng)濟(jì)學(xué)角度分析開源芯片的文章《駁“發(fā)展開源芯片弊大于利”論》。我曾經(jīng)看過其他DARPA的材料,也都能看到類似這種跳出技術(shù)本身、從更宏觀的角度分析的思路,很值得學(xué)習(xí)。

微信圖片_20190811222433.jpg

  圖9. 傳統(tǒng)初創(chuàng)企業(yè)Seed/A輪/B輪融資額度穩(wěn)步提升,但芯片初創(chuàng)企業(yè)A輪就需要2000萬美元

微信圖片_20190811222431.jpg

  圖10. DARPA希望能將芯片設(shè)計(jì)門檻降下來,促進(jìn)風(fēng)投和初創(chuàng)行業(yè),推動(dòng)創(chuàng)新

  ERI自從2017年啟動(dòng)以來,其資助的研究?jī)?nèi)容越來越成體系。下圖是DARPA ERI項(xiàng)目所資助的21個(gè)項(xiàng)目一覽圖。DARPA每年也會(huì)在7月份舉辦ERI Summit,將這些項(xiàng)目的核心成員們召集研討進(jìn)展與下階段工作。值得一提的是ERI Summit的報(bào)告材料都是可以公開下載,這是2018年的日程與報(bào)告下載地址:[http://eri-summit.com/agenda]

微信圖片_20190811222429.jpg

  圖11. DARPA ERI項(xiàng)目所資助的21個(gè)項(xiàng)目一覽圖

  報(bào)告4:高效開源EDA工具鏈已在路上(OpenROAD)

  UCSD的Andrew Kahng教授獲得了DARPA項(xiàng)目的資助,開展高效開源EDA工具鏈的研究。他認(rèn)為EDA以前是關(guān)注質(zhì)量,但現(xiàn)在該開始關(guān)注把易用性了。他參與的DARPA IDEA項(xiàng)目目標(biāo)非常激進(jìn)——24小時(shí)內(nèi)全自動(dòng)地完成IP、SoC芯片、PCB版的設(shè)計(jì)(圖12)。

  在DARPA的資助下,他帶領(lǐng)團(tuán)隊(duì)啟動(dòng)了OpenROAD項(xiàng)目,該項(xiàng)目將從四個(gè)維度來應(yīng)對(duì)芯片設(shè)計(jì)復(fù)雜度問題:(1)最大化劃分,將大的設(shè)計(jì)盡可能劃分為小模塊,這樣可以兩個(gè)好處,一方面是降低算法復(fù)雜度,另一方面就是更易挖掘并行性;(2)并行優(yōu)化,這一點(diǎn)與前面最大化劃分密切聯(lián)想,當(dāng)存在大量并行度時(shí),就可以采用各種加速并行的技術(shù)來優(yōu)化,包括使用GPU來加速;(3)采用機(jī)器學(xué)習(xí)的工具與流程,傳統(tǒng)芯片設(shè)計(jì)流程中有很多經(jīng)驗(yàn)規(guī)則,這一點(diǎn)可以通過訓(xùn)練大量已有設(shè)計(jì)變成神經(jīng)網(wǎng)絡(luò)模型,從而加速最優(yōu)電路設(shè)計(jì)的搜索和預(yù)測(cè)。這方面也是Kahng教授在報(bào)告中特別強(qiáng)調(diào)的;(4)受限的布局方案也可以減少布局布線時(shí)的算法復(fù)雜度。

  OpenRoad將于今年推出Alpha版,然后在2020年推出v1.0版本。

微信圖片_20190811222428.jpg

  圖12. DARPA IDEA項(xiàng)目的目標(biāo)是全自動(dòng)化(無人干預(yù))、24小時(shí)完成全系統(tǒng)硬件設(shè)計(jì)

微信圖片_20190811222425.jpg

  圖13. OpenRoad在四方面進(jìn)行優(yōu)化

微信圖片_20190811222423.jpg

  圖14. OpenRoad將于今明兩年開源

  EDA是國(guó)內(nèi)芯片設(shè)計(jì)產(chǎn)業(yè)最大的軟肋,中國(guó)的EDA工具企業(yè)始終未能做大做強(qiáng)。如今,美國(guó)開始將EDA轉(zhuǎn)向開源,中國(guó)又應(yīng)該如何應(yīng)對(duì)?這個(gè)問題值得認(rèn)真研究。我自己的觀點(diǎn)是開源總體對(duì)中國(guó)是有利的,但開源也存在競(jìng)爭(zhēng),只有更多的投入、參與和貢獻(xiàn),才能在開源社區(qū)中起到主導(dǎo)作用。中國(guó)不一定能在所有環(huán)節(jié)上都存在優(yōu)勢(shì),但還是有可能在某些環(huán)節(jié)上推出有競(jìng)爭(zhēng)力的開源EDA工具。

微信圖片_20190811222421.jpg

  圖15. 全世界范圍內(nèi)開源EDA工具出現(xiàn)快速增長(zhǎng)趨勢(shì)

  報(bào)告5:中國(guó)的聲音

  我是這屆遠(yuǎn)景研討會(huì)上唯一一位來自美國(guó)以外的報(bào)告人,這也反映了美國(guó)在這個(gè)方向上處于絕對(duì)領(lǐng)先地位。我的報(bào)告題目是“The Four Steps to An Open-Source Chip Ecosystem”,根據(jù)過去幾年在開源芯片與敏捷開放領(lǐng)域的一些實(shí)踐,梳理了構(gòu)建開源芯片生態(tài)所需要突破的四個(gè)方面:開源ISA/IP/SoC、開源EDA工具鏈、高效低成本的仿真驗(yàn)證、系統(tǒng)軟件。然后對(duì)每一部分的現(xiàn)狀和未來努力方向進(jìn)行了分析。

微信圖片_20190811222420.jpg

  圖16. 構(gòu)建開源芯片生態(tài)所需要突破的四個(gè)要素

  報(bào)告6:CHIPS聯(lián)盟與開源UVM驗(yàn)證框架

  來自Google的Richard Ho博士介紹了CHIPS聯(lián)盟——這是近期Google聯(lián)合了6家企業(yè)成立了一個(gè)開源芯片聯(lián)盟,旨在推動(dòng)開源芯片生態(tài)(圖17)。這7家企業(yè)每一家都貢獻(xiàn)了開源芯片設(shè)計(jì)中所需要的功能模塊,例如西部數(shù)據(jù)的SweRV核、SiFive的Rocket核、Google的RISC-V-DV驗(yàn)證工具等。從圖18可以看到,越來越多的開源工具開始出現(xiàn),未來基于全開源EDA工具設(shè)計(jì)開源芯片,將不會(huì)是空談。

微信圖片_20190811222418.jpg

  圖17. CHIPS聯(lián)盟旨在推動(dòng)開源芯片生態(tài)

微信圖片_20190811222416.jpg

  圖18. 越來越多的開源工具開始出現(xiàn)

  Google開源了一個(gè)面向RISC-V的驗(yàn)證框架(圖19),可以通過RISC-V-DV來產(chǎn)生指令流,對(duì)設(shè)計(jì)進(jìn)行壓力測(cè)試。芯片設(shè)計(jì)過程中的驗(yàn)證環(huán)境非常耗時(shí)耗力,但又是極其重要的環(huán)節(jié)。應(yīng)該說Google的這個(gè)開源工具確實(shí)芯片設(shè)計(jì)中的痛點(diǎn),但如何能靈活應(yīng)對(duì)不同的設(shè)計(jì),如何能達(dá)到更高的性能,這些都還需要不斷優(yōu)化。

微信圖片_20190811222414.jpg

  圖19.  Google開源的針對(duì)RISC-V的驗(yàn)證框架

  報(bào)告7:硬件加速器設(shè)計(jì)與領(lǐng)域?qū)S谜Z言DSL

  美國(guó)工程院院士、斯坦福大學(xué)的Mark Horowitz教授介紹了他們?cè)诩铀倨黝I(lǐng)域的工作。Horowitz教授早期參與了很多多處理器架構(gòu)、高帶寬內(nèi)存的研究,創(chuàng)辦了Rambus公司。在這個(gè)報(bào)告中,他認(rèn)為設(shè)計(jì)一個(gè)硬件加速器的本質(zhì)就是將應(yīng)用快速地映射到硬件上,這可以分解為三個(gè)步驟(圖20):(1)用領(lǐng)域?qū)S谜Z言DSL來寫應(yīng)用;(2)用編譯器將應(yīng)用映射到可編程的硬件模型(也可以看作某種粒度的ISA)上;(3)將ISA映射到目標(biāo)硬件上。

  Horowitz教授接著介紹了團(tuán)隊(duì)正在開發(fā)的AHA工具鏈,融合了上述三個(gè)步驟(圖21)。報(bào)告非常精彩的部分是他坦言到雖然這套工具鏈能工作,也開發(fā)出了芯片,但還存在很大的問題,整個(gè)工具鏈需要重構(gòu)。然后他總結(jié)了6個(gè)經(jīng)驗(yàn)教訓(xùn):(1)敏捷開發(fā)應(yīng)該關(guān)注系統(tǒng)構(gòu)建,而不僅僅是加速器的性能,用戶關(guān)心的應(yīng)用最終性能;(2)硬件設(shè)計(jì)不只是功能,還包括很多復(fù)雜問題,如時(shí)序、布局、測(cè)試生成等,這些都不應(yīng)該暴露給用戶,因此可以通過DSL+編譯器來為用戶屏蔽這些底層細(xì)節(jié);(3)用戶使用加速器時(shí)都會(huì)重寫應(yīng)用代碼,既然需要重寫,從一開始就應(yīng)該讓用戶使用DSL;(4)用戶希望為一類應(yīng)用設(shè)計(jì)加速器,而不是僅僅為一個(gè)應(yīng)用,因此粗粒度可重構(gòu)架構(gòu)CGRA是很好的選擇;(5)敏捷開發(fā)的核心是重用,因此要盡可能設(shè)計(jì)一些新工具提供重用度;(6)開源硬件可以降低NRE成本,降低維護(hù)成本,但開源硬件的形式不一定是硬件,而將會(huì)是以軟件工具或代碼的形式。

  Horowitz教授的這幾點(diǎn)經(jīng)驗(yàn)教訓(xùn)具有很強(qiáng)的啟發(fā)性,也很具有可操作性,他們團(tuán)隊(duì)的工作值得關(guān)注。

微信圖片_20190811222409.jpg

  圖20. 硬件加速器的本質(zhì)就是將應(yīng)用快速地映射到硬件

微信圖片_20190811222406.jpg

  圖21. 斯坦福大學(xué)開發(fā)的芯片敏捷開發(fā)AHA工具鏈

  報(bào)告8:高層次綜合

  美國(guó)工程院院士、UCLA的Jason Cong教授是FPGA與高層次綜合HLS(High-Level Synthesis)領(lǐng)域的頂尖專家。HLS是從1980年代FPGA興起時(shí)CMU、IBM等就開始研究,但一直未能形成商用。從2006年開始,Cong教授在UCLA啟動(dòng)了xPilot項(xiàng)目,后成立公司AutoESL推出AutoPilot工具,并于2011年被Xilinx收購(gòu)集成為Vivado HLS工具。在報(bào)告中,Cong教授指出HLS還面臨兩大挑戰(zhàn)(圖22):

  (1)需要花大力氣對(duì)代碼重構(gòu)才能達(dá)到好的性能,簡(jiǎn)單的C代碼在綜合得到硬件后甚至可能比CPU性能慢上百倍(圖23)。Cong教授團(tuán)隊(duì)認(rèn)為可通過編譯優(yōu)化技術(shù)來解決這個(gè)問題,因此開發(fā)了一個(gè)編譯器Merlin,簡(jiǎn)化代碼重構(gòu)工作。體系結(jié)構(gòu)設(shè)計(jì)的“三大法寶”為并行、流水和緩存。Merlin編譯器的目標(biāo)是將“三大法寶”對(duì)應(yīng)的設(shè)計(jì)規(guī)則集成到編譯器中,從而在整個(gè)過程中減少人的參與。

 ?。?)如何在很大的設(shè)計(jì)空間中找到優(yōu)化設(shè)計(jì)也是一個(gè)很大的挑戰(zhàn)。前面提到體系結(jié)構(gòu)層次有“三大法寶”,而在具體設(shè)計(jì)時(shí)每一個(gè)法寶都有很多種選擇,因此設(shè)計(jì)空間很大。這個(gè)挑戰(zhàn)不僅僅是學(xué)術(shù)界關(guān)心,事實(shí)上工業(yè)界也很關(guān)心,我們和海思技術(shù)交流中也提到這點(diǎn)。為了應(yīng)對(duì)這個(gè)問題,Cong教授團(tuán)隊(duì)開發(fā)了一套自動(dòng)化設(shè)計(jì)空間探索框架(Automated design space exploration framework)。目前還主要是基于梯度進(jìn)行空間搜索,這方面還有很大的優(yōu)化空間。

微信圖片_20190811222403.jpg

  圖22. 高層次綜合HLS面臨的兩大挑戰(zhàn)

微信圖片_20190811222401.jpg

  圖23. C代碼需要重構(gòu)才能獲得加速,否則可能會(huì)比CPU慢上百倍

  Cong教授認(rèn)為讓程序員來寫HLS代碼效率太低,應(yīng)該提供更高抽象的語言,即領(lǐng)域?qū)S玫恼Z言DSL——程序員用更高級(jí)的DSL來寫代碼,然后自動(dòng)生成HLS代碼,進(jìn)而映射到FPGA上(圖24)。到這里可以看出這個(gè)技術(shù)思路與斯坦福Horowitz教授提出的三個(gè)步驟一致,如果接著往下看,也會(huì)發(fā)現(xiàn)第10個(gè)來自Berkeley的報(bào)告也是同樣的理念。

微信圖片_20190811222400.jpg

  圖24. DSL能提高HLS開發(fā)效率

  報(bào)告9:英偉達(dá)的敏捷開發(fā)實(shí)踐

  英偉達(dá)ASIC與VISL研究部門主任Brucek Khailany介紹了他們采用機(jī)器學(xué)習(xí)方法的敏捷開發(fā)技術(shù)。英偉達(dá)積極投入芯片敏捷開發(fā),其動(dòng)力也是因?yàn)楝F(xiàn)在芯片設(shè)計(jì)太過復(fù)雜。例如,英偉達(dá)產(chǎn)品的開發(fā)周期一般需要3-5年,其中設(shè)計(jì)與驗(yàn)證的時(shí)間與成本占比大約70%(圖25),2018年Nvidia Xavier SoC一共花了8000人年!因此英偉達(dá)希望能將開發(fā)周期與成本降低一個(gè)數(shù)量級(jí)。

  英偉達(dá)的總體思路包含三個(gè)要點(diǎn)(圖26):(1)使用更高級(jí)的開發(fā)語言,英偉達(dá)選擇的是C++;(2)利用HLS工具將C++代碼轉(zhuǎn)變?yōu)镽TL代碼,從而可以嫁接到現(xiàn)有的ASIC開發(fā)流程;(3)充分使用已經(jīng)開發(fā)好的庫和生成器(libraries/generator),盡可能地重用已有設(shè)計(jì)從而節(jié)省時(shí)間。值得一提的是,第(3)點(diǎn)庫和生成器是面向領(lǐng)域?qū)S玫男酒艚蓍_發(fā)方法中很重要的環(huán)節(jié),未來將會(huì)決定芯片敏捷開發(fā)的性能與質(zhì)量。最近這方面的工作也開始增加,比如英偉達(dá)開發(fā)的MatchLib,Berkeley開發(fā)的面向RISC-V的Rocket Chip Generator和面向模擬電路的Analogy Generator(下一章節(jié)將會(huì)介紹)。

  最后Khailany簡(jiǎn)要總結(jié)了將機(jī)器學(xué)習(xí)應(yīng)用到芯片設(shè)計(jì)自動(dòng)化方面的相關(guān)工作(圖27)。如之前Cong教授報(bào)告中提到,設(shè)計(jì)自動(dòng)化中面臨的挑戰(zhàn)之一便是巨大的設(shè)計(jì)空間。深度學(xué)習(xí)在大空間高效搜索方面則具有很大的潛力。

微信圖片_20190811222358.jpg

  圖25. 英偉達(dá)產(chǎn)品開發(fā)周期需要3-5年,設(shè)計(jì)與驗(yàn)證占比大約70%

微信圖片_20190811222357.jpg

  圖26. 敏捷開發(fā)思路三個(gè)要點(diǎn):高層次語言、工具、庫/生成器

微信圖片_20190811222355.jpg

  圖27. 機(jī)器學(xué)習(xí)為敏捷開發(fā)帶來的機(jī)遇

  報(bào)告10:支持硬件敏捷開發(fā)的新語言與生成器

  Berkeley的 Borivoje Nikoli? 教授的核心觀點(diǎn)是生成器(generator)將是芯片敏捷開發(fā)的核心(圖28),可以降低芯片設(shè)計(jì)的成本和開發(fā)周期。生成器技術(shù)和軟件開發(fā)中的面向?qū)ο笏枷胗泻芏嘞嗤ㄖ帲琯enerator可以看作是一個(gè)class。簡(jiǎn)單總結(jié)一下這種方式的好處:(1)重用度高,一個(gè)生成器可產(chǎn)生很多實(shí)例;(2)更易定制化,可通過修改參數(shù)產(chǎn)生不同的實(shí)例;(3)便于驗(yàn)證,理論上對(duì)生成器充分驗(yàn)證(包括形式化驗(yàn)證),可以保障生成實(shí)例的正確性。

  Nikoli?教授帶領(lǐng)團(tuán)隊(duì)過去幾年在這方面做出了杰出的貢獻(xiàn)。他們發(fā)明了具備更高抽象能力的Chisel語言,使生成器的開發(fā)變得更簡(jiǎn)單。事實(shí)上,近年來非?;鸬腞ISC-V最早開源實(shí)現(xiàn)Rocket Chip實(shí)現(xiàn)就是一個(gè)基于Chisel的生成器(圖31)。

  一款SoC芯片設(shè)計(jì)很大的挑戰(zhàn)是模擬電路。Nikoli?教授開發(fā)了BAG(Berkeley Analog Generator),一套基于Python的開源模擬電路生成器(圖29),包括 Comparator 、多種ADC/DAC生成器、SerDes生成器(圖30)等。這些生成器在ST 28nm, GF 22nm, TSMC 16nm等不同工藝下成功流片。當(dāng)然目前實(shí)測(cè)性能與業(yè)界主流產(chǎn)品相比還有差距,比如使用TSMC 16nm工藝的ADC采樣頻率為7GS/s,精度為6.5bit,而ADI公司于2017年便開發(fā)出基于28nm工藝的10GS/s、精度為12bit的產(chǎn)品。但值得一提的是這些都是開源設(shè)計(jì),如果社區(qū)和企業(yè)在此基礎(chǔ)上不斷優(yōu)化改進(jìn),有可能最終得到足夠性能的開源模擬電路設(shè)計(jì)。

微信圖片_20190811222350.jpg

  圖28. 生成器(generator)是芯片敏捷開發(fā)的核心

微信圖片_20190811222348.jpg

  圖29. 數(shù)字電路生成器Chisel3和模擬電路生成器BAG2

微信圖片_20190811222339.jpg

  圖30. 基于BAG2的SerDes生成器

微信圖片_20190811222303.jpg

  圖31. 基于Chisel與BAG生成的RISC-V芯片

  報(bào)告11:端到端的形式化驗(yàn)證

  形式化驗(yàn)證(Formal Verification)方法被認(rèn)為是保證系統(tǒng)正確性的最有效方法。自從2009年第一個(gè)經(jīng)過形式化驗(yàn)證的操作系統(tǒng)內(nèi)核SeL4發(fā)表以來,形式化驗(yàn)證方法已收到越來越多地關(guān)注,尤其是在操作系統(tǒng)領(lǐng)域。2016年,美國(guó)NSF在計(jì)算機(jī)領(lǐng)域額度最大的“Expedition in Computing”項(xiàng)目(5年1000萬美元)資助了由普林斯頓大學(xué)、麻省理工學(xué)院、康奈爾大學(xué)、賓夕法尼亞大學(xué)聯(lián)合申請(qǐng)的形式化驗(yàn)證軟硬件全系統(tǒng)棧的項(xiàng)目:DeepSpec(圖32),一個(gè)目標(biāo)極其遠(yuǎn)大而具有顛覆性、同時(shí)也極具挑戰(zhàn)的研究項(xiàng)目。

  MIT的Adam Chlipala教授也是DeepSpec的co-PI,他在Visioning Workshop上介紹了基于RISC-V開展的全系統(tǒng)端到端強(qiáng)形式化驗(yàn)證研究進(jìn)展(圖33),包括硬件RTL層次的驗(yàn)證、編譯器的驗(yàn)證等。Chlipala教授展示了一個(gè)經(jīng)過驗(yàn)證的RISC-V核實(shí)現(xiàn)(圖34,圖35),目前還只能用于演示點(diǎn)燈。

  報(bào)告中我的理解是相比于傳統(tǒng)的Verilog,具有更高抽象的硬件描述語言(如BlueSpec、Chisel)將有助于RTL層次的形式化驗(yàn)證。不過由于自己對(duì)這個(gè)領(lǐng)域也了解不多,所以也無法更深入地解讀他們的研究工作。

  在這里可以分享一段有趣的經(jīng)歷:我在普林斯頓大學(xué)做博士后時(shí)在同一個(gè)辦公室的是Andrew Appel教授的博士后Lennart Beringer,當(dāng)時(shí)正在開展編譯器的形式化驗(yàn)證研究。當(dāng)時(shí)曾問過他形式化驗(yàn)證的前景,他自己認(rèn)為可能需要20年才能實(shí)用。讓人感慨的是,幾年后,即使在一線研究人員看來都很遙遠(yuǎn)的研究卻得到了NSF的大力資助,而Lennart現(xiàn)在也正是DeepSpec項(xiàng)目的副主任。相比較于美國(guó)大力資助形式化驗(yàn)證的系統(tǒng)實(shí)現(xiàn),國(guó)內(nèi)從事這方面研究的團(tuán)隊(duì)就顯得太少了,也很難得到資助。這種現(xiàn)狀亟需改變。

微信圖片_20190811222256.jpg

  圖32. 2016年NSF Expedition in Computing項(xiàng)目:DeepSpec

微信圖片_20190811222253.jpg

  圖33. 端到端形式化驗(yàn)證框架

微信圖片_20190811222249.jpg

  圖34. RISC-V核的形式化驗(yàn)證示例

微信圖片_20190811222246.jpg

  圖35. 經(jīng)過驗(yàn)證的RISC-V核

  中國(guó)的挑戰(zhàn)與機(jī)遇

  芯片一直是中國(guó)半導(dǎo)體產(chǎn)業(yè)的軟肋,如何破解中國(guó)半導(dǎo)體產(chǎn)業(yè)面臨的“卡脖子”問題,各界都在積極實(shí)踐與探索。

  中國(guó)當(dāng)前需要盡快突破被稱為是“燃眉之急”的多項(xiàng)關(guān)鍵技術(shù),但從長(zhǎng)遠(yuǎn)來看,中國(guó)芯片領(lǐng)域面臨的 “卡脖子”問題根源在于優(yōu)秀人才儲(chǔ)備嚴(yán)重不足——我們?cè)鲞^一項(xiàng)統(tǒng)計(jì),2008到2017年的十年間體系結(jié)構(gòu)頂會(huì)ISCA論文的第一作者(可認(rèn)為是芯片架構(gòu)研究?jī)?yōu)秀人才)85%選擇在美國(guó)就業(yè),僅有4%在中國(guó)就業(yè),差距巨大(圖36)。這與當(dāng)前芯片設(shè)計(jì)門檻過高,導(dǎo)致中國(guó)大學(xué)無法開展芯片相關(guān)教學(xué)與研究密切相關(guān)。

  這種人才危機(jī)美國(guó)也曾經(jīng)歷過,1982年全美上千所大學(xué)中只有不到100 位教授和學(xué)生從事半導(dǎo)體相關(guān)的研究。為了應(yīng)對(duì)人才危機(jī),美國(guó)DARPA在1981年啟動(dòng)MOSIS項(xiàng)目,為大學(xué)提供流片服務(wù),通過MPW模式大幅降低芯片設(shè)計(jì)門檻(圖37)。三十余年來MOSIS為大學(xué)和研究機(jī)構(gòu)流了60000多款芯片,培養(yǎng)了數(shù)萬名學(xué)生。因此,降低芯片設(shè)計(jì)門檻亦可大幅提高人才培養(yǎng)效率。

  開源芯片與敏捷開發(fā),有可能再未來實(shí)現(xiàn)數(shù)量級(jí)地降低芯片開發(fā)門檻。開源芯片生態(tài)仍處于起步階段,如果中國(guó)能積極參與并主導(dǎo)開源芯片生態(tài)中若干核心模塊,那么就有可能吸引更多開發(fā)人員、民間資本參與芯片開發(fā),提高芯片領(lǐng)域的創(chuàng)新活力,同時(shí)也能為中國(guó)芯片企業(yè)提供基于開源的芯片關(guān)鍵技術(shù)與優(yōu)秀人才、擺脫“卡脖子”困境。

微信圖片_20190811222242.jpg

  圖36. “卡脖子”問題根源在于優(yōu)秀人才儲(chǔ)備嚴(yán)重不足

微信圖片_20190811222240.jpg

  圖37. 美國(guó)應(yīng)對(duì)半導(dǎo)體人才危機(jī)的方式

  結(jié)語:2030憧憬

  總結(jié)來說,開源芯片與敏捷開發(fā)備受關(guān)注,背后存在兩方面的驅(qū)動(dòng)力:

 ?。?)應(yīng)對(duì)摩爾定律終結(jié)的技術(shù)發(fā)展需求:Dennard Scaling定律和摩爾定律逐漸走向終結(jié),但摩爾定律賦予芯片的能力并未充分挖掘出來。例如實(shí)現(xiàn)一個(gè)矩陣乘法,普通程序員寫的程序和懂體系架構(gòu)的專家寫的程序性能上甚至?xí)?3000倍的差距。因此,面向某個(gè)特定領(lǐng)域?qū)<抑R(shí)實(shí)現(xiàn)到芯片中,就有可能提升幾百甚至幾千倍的性能功耗比,從而充分挖掘芯片上晶體管的潛力。但這種領(lǐng)域?qū)S皿w系結(jié)構(gòu)(DSA)會(huì)帶來碎片化問題,需要從芯片設(shè)計(jì)成本與周期兩個(gè)維度同時(shí)降低門檻,才能應(yīng)對(duì)種類繁多的領(lǐng)域?qū)S眉铀倨鳌?/p>

 ?。?)激發(fā)創(chuàng)新活力、繁榮芯片產(chǎn)業(yè)的市場(chǎng)需求:長(zhǎng)期以來芯片研發(fā)成本高、周期長(zhǎng),導(dǎo)致了該領(lǐng)域的高門檻,嚴(yán)重阻礙了創(chuàng)新。即使研制一款中檔芯片,也往往需要數(shù)百人年、數(shù)千萬甚至上億的研發(fā)投入,導(dǎo)致資本不愿投資。因此,只有少數(shù)企業(yè)才能承擔(dān),資本市場(chǎng)對(duì)芯片投資也是極其謹(jǐn)慎保守,制約了芯片領(lǐng)域的創(chuàng)新活力。

  構(gòu)建開源芯片生態(tài)與敏捷開發(fā)方法一個(gè)長(zhǎng)期的系統(tǒng)工程,面臨著諸多挑戰(zhàn),但也是一個(gè)不管是學(xué)術(shù)上還是商業(yè)上都值得探索的方向,也需要各界的支持與參與。

  后記:IEEE MICRO特刊

  Visioning Workshop結(jié)束后的第二天,IEEE MICRO雜志的主編和編委聯(lián)系到我。他們也在現(xiàn)場(chǎng)聽了報(bào)告,認(rèn)為這個(gè)方向很重要,邀請(qǐng)我來組織一期關(guān)于敏捷開發(fā)與開源硬件的特刊,我欣然接受。經(jīng)過前期的一些討論,現(xiàn)在已經(jīng)確定了幾個(gè)時(shí)間節(jié)點(diǎn),Call-for-Paper也已出爐。歡迎大家賜稿!

微信圖片_20190811222234.jpg

  圖38. Call-for-Paper of IEEE Micro Special Issue


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。