123,123

关于芯片产业的未来，专家是这样看的！

日期： 2019-08-11

關(guān)鍵詞： 芯片产业

　　2019年度國際計(jì)算機(jī)體系結(jié)構(gòu)旗艦會(huì)議ISCA于6月在美國亞利桑那州鳳凰城召開。6月23日與ISCA一起舉行的遠(yuǎn)景研討會(huì)（SIGARCH Visioning Workshop）吸引了上百位聽眾。一方面是因?yàn)榇舜窝杏憰?huì)主題“面向下一代計(jì)算的敏捷開放硬件（Agile and Open Hardware for Next-Generation Computing）”是當(dāng)前體系結(jié)構(gòu)研究領(lǐng)域的前沿?zé)狳c(diǎn)，引起了很多人的關(guān)注；另一方面11位報(bào)告人中大牛云集，有圖靈獎(jiǎng)得主David Patterson教授，也有多位美國工程院院士加持，還有來自MIT、Berkeley、Stanford、UCSD、Google、Nvidia、DARPA等頂尖大學(xué)、企業(yè)和政府機(jī)構(gòu)的專家（自己成了唯一的一位來自美國以外的報(bào)告人，多少有些勢(shì)單力?。?。

　　全程聽完了一天的報(bào)告，我的最大感觸是開源硬件（芯片）在美國各界已經(jīng)成為一種共識(shí)——從學(xué)術(shù)界、企業(yè)界到DARPA這樣的政府機(jī)構(gòu)，都在積極投入到開源芯片與芯片敏捷開發(fā)方向的研究中。早在2016年的首屆Architecture 2030遠(yuǎn)景研討會(huì)上，很多人就認(rèn)為開源硬件將會(huì)是未來的大主題（Big Theme，如圖1）。而在國內(nèi)，很多人對(duì)開源硬件/芯片的理解還有些片面，只是認(rèn)為“開源芯片=RISC-V”。

微信圖片_20190811222453.jpg

　　圖1. 2016年遠(yuǎn)景研討會(huì)上開源硬件便備受關(guān)注

　　遠(yuǎn)景研討會(huì)（Visioning Workshop）

　　ACM體系結(jié)構(gòu)專業(yè)委員會(huì)SIGARCH組織的遠(yuǎn)景研討會(huì)（Visioning Workshop）是一個(gè)暢想未來的學(xué)術(shù)研討會(huì)。第一屆在2016年的ISCA上舉辦，當(dāng)年的主題是《Architecture 2030》，知名華人學(xué)者UCSB的謝源教授受邀做了題為《Technology-driven Architecture Innovation: Challenges and Opportunities》的報(bào)告。第二屆是在多倫多舉辦的ISCA上，主題為《Trends in Machine Learning》，圖靈獎(jiǎng)得主 Yoshua Bengio 教授以及陳天奇、賈揚(yáng)清兩位博士均為受邀報(bào)告人。

　　今年是第三屆，主題是“Agile and Open Hardware for Next-Generation Computing”，一共有11個(gè)報(bào)告，以下是議程。

　　David Patterson, UC Berkeley/Google, A New Golden Age for Computer Architecture

　　Vivienne Sze, MIT, Domain-Specific Architectures for AI and Robotics: Opportunities and Challenges

　　Serge Leef, DARPA, Automatic Implementation of Secure Silicon

　　Andrew Kahng, UCSD, Bringing Design Technology and Architecture Closer Together: What Open Source Might Enable

　　Yungang Bao, Chinese Academy of Sciences, The Four Steps to An Open-Source Chip Design Ecosystem

　　Richard Ho, Google, Building A Sustainable Open-Source Hardware Ecosystem

　　Mark Horowitz, Stanford, AHA! – Agile HArdware

　　Jason Cong, UCLA, Democratize Customizable Computing

　　Brucek Khailany, NVIDIA, Machine-Learning-Assisted Agile VLSI Design for Machine Learning

　　Borivoje Nikoli?, UC Berkeley, Generating the Next Wave of Custom Chips

　　Adam Chlipala, MIT, Strong Formal Verification Across a Hardware-Software Stack with RISC-V

微信圖片_20190811222447.jpg

　　圖3. 2019年遠(yuǎn)景研討會(huì)11位報(bào)告人

　　報(bào)告1：圖靈獎(jiǎng)得主David Patterson教授眼中的體系結(jié)構(gòu)黃金時(shí)代

　　Patterson教授介紹敏捷與開放體系結(jié)構(gòu)的挑戰(zhàn)與機(jī)遇。其實(shí)他的報(bào)告在很多場(chǎng)合都有講過，其中他對(duì)處理器指令集標(biāo)準(zhǔn)與架構(gòu)設(shè)計(jì)的分類值得專門再提一下。

　　首先，他向大家強(qiáng)調(diào)ISA指令集、微結(jié)構(gòu)設(shè)計(jì)、產(chǎn)品是三個(gè)層次。如圖4，ISA是規(guī)范標(biāo)準(zhǔn)，往往用一本書甚至幾張紙來記錄描述；微結(jié)構(gòu)設(shè)計(jì)是具體實(shí)現(xiàn)，對(duì)應(yīng)的是源代碼；產(chǎn)品則是設(shè)計(jì)的實(shí)例化，比如RedHat推出的Linux發(fā)行版。他進(jìn)一步將指令集標(biāo)準(zhǔn)與架構(gòu)設(shè)計(jì)都分為三類：開放免費(fèi)（open & free）、可授權(quán)（Licensiable）、封閉（closed）。于是，我們可以看到，Intel就屬于封閉指令集+封閉設(shè)計(jì)，ARM屬于可授權(quán)指令集+可授權(quán)設(shè)計(jì)，但要獲得授權(quán)價(jià)格不菲，往往需要上百萬甚至數(shù)千萬美元。

　　RISC-V為全世界提供了開放免費(fèi)指令集+開放免費(fèi)設(shè)計(jì)的選擇。根據(jù)圖5的第一行，我們可以知道只有先有了開源開放的指令集，才有可能有開源開放的微架構(gòu)設(shè)計(jì)，即綠色格子。需要強(qiáng)調(diào)的是RISC-V本身是一種標(biāo)準(zhǔn)規(guī)范，和C/C++語言規(guī)范、POSIX系統(tǒng)調(diào)用等這些標(biāo)準(zhǔn)是一樣的。本身是開放的，誰都可以基于這些標(biāo)準(zhǔn)來實(shí)現(xiàn)自己的處理器。但有一點(diǎn)需要厘清的是即使都是基于開源開放指令集（比如RISC-V），也存在三種不同的商業(yè)模式：（1）Google、NVidia等企業(yè)在內(nèi)部大量使用RISC-V核作為MCU，但他們不對(duì)外開放IP以及源代碼，這就屬于第一行的紅色格子；（2）SiFive公司、中國臺(tái)灣晶心Andes、阿里平頭哥的RISC-V核是可以被授權(quán)給第三方使用，但并不開源RTL級(jí)源碼，因此屬于橙色格子；（3）Berkeley的Rocket Chip、劍橋大學(xué)的LowRISC、蜂鳥E203等RISC-V核將RTL級(jí)源碼也開源，這些設(shè)計(jì)可歸到綠色格子。

　　圖4.ISA指令集、微結(jié)構(gòu)設(shè)計(jì)、產(chǎn)品三個(gè)層次以及對(duì)應(yīng)的三種商業(yè)模式

微信圖片_20190811222444.jpg

　　圖5. 三種不同商業(yè)模式形成處理器分類

　　從圖5第一行可知，開放開源指令集并不等于就有了開源的微結(jié)構(gòu)設(shè)計(jì)，這兩者很容易被混為一談。很多人也誤判RISC-V受到DARPA資助會(huì)影響其開放性。事實(shí)上，TCP/IP協(xié)議也是DARPA資助下形成的互連標(biāo)準(zhǔn)，但在具體實(shí)現(xiàn)層面也可以有不同商業(yè)模式：（1）在網(wǎng)絡(luò)協(xié)議棧的軟件實(shí)現(xiàn)方面，有集成到BSD/Linux中的開源TCP/IP協(xié)議棧，也有微軟實(shí)現(xiàn)集成到商用Windows的TCP/IP協(xié)議棧；（2）在硬件實(shí)現(xiàn)方面上，美國思科公司可以研發(fā)支持IP協(xié)議的路由器，中國華為公司也可以研制自己支持IP協(xié)議的路由器，并不會(huì)因?yàn)槭荰CP/IP協(xié)議是受DARPA支持而不能使用。

　　另一個(gè)典型的例子是龍芯。龍芯是基于MIPS指令集發(fā)展起來的，而MIPS最早是由美國企業(yè)開發(fā)和維護(hù)的，但人們都認(rèn)為龍芯是自主設(shè)計(jì)開發(fā)的，這正是區(qū)分了標(biāo)準(zhǔn)規(guī)范和微架構(gòu)設(shè)計(jì)。但談到RISC-V時(shí)，大家又經(jīng)?；鞛橐徽?，實(shí)不應(yīng)該。

　　報(bào)告2：面向AI和機(jī)器人的加速器設(shè)計(jì)

　　MIT的Vivienne Sze教授介紹了面向AI、機(jī)器人和視頻壓縮的加速器設(shè)計(jì)。如圖6所示，Sze教授認(rèn)為領(lǐng)域?qū)Ｓ眉铀倨髟O(shè)計(jì)的套路是：（1）挖掘應(yīng)用特征——利用專用硬件來將并行性、數(shù)據(jù)訪問特征等特征轉(zhuǎn)變?yōu)橥掏屡c能效；（2）設(shè)計(jì)更高效負(fù)載——在不影響結(jié)果質(zhì)量的前提下，通過算法與硬件協(xié)同設(shè)計(jì)更高效的負(fù)載；（3）定義應(yīng)用范圍——根據(jù)應(yīng)用需求平衡靈活性與效率。

　　Sze教授用了三個(gè)例子分別展示這個(gè)套路的有效性，即DNN、機(jī)器人自動(dòng)導(dǎo)航、視頻壓縮。圖7是一個(gè)DNN的例子，其他兩個(gè)例子可以直接看她的PPT材料。

　　Sze教授近年來獲得了各種獎(jiǎng)項(xiàng)，今年ISCA上她的學(xué)生也獲得了最佳博士論文獎(jiǎng)。個(gè)人覺得他們團(tuán)隊(duì)的工作屬于穩(wěn)扎穩(wěn)打型，他們的設(shè)計(jì)中采用的技術(shù)方案都是意料之中，并沒有特別的亮眼的地方。但是他們的工作做得非常扎實(shí)，每一項(xiàng)工作都會(huì)把芯片做出來（如圖8），讓人很佩服。相比之下很多其他團(tuán)隊(duì)的工作更多只是停留在論文階段的漂亮設(shè)計(jì)。

　　題外話：Sze教授的研究工作風(fēng)格讓我想起中科院動(dòng)物所所長周琪院士的團(tuán)隊(duì)。周所在報(bào)告時(shí)提到他的學(xué)生曾抱怨，“我們發(fā)表一篇文章數(shù)據(jù)量是其他團(tuán)隊(duì)的10倍，有這個(gè)必要嗎？”他的回答是：“你以后會(huì)認(rèn)識(shí)到，發(fā)表文章不是最難的，最難的是文章發(fā)表了要把它撤回來”。世界頂尖團(tuán)隊(duì)的研究風(fēng)格都是類似的。

微信圖片_20190811222443.jpg

　　圖6. 硬件加速器設(shè)計(jì)三部曲

微信圖片_20190811222437.jpg

　　圖7. 采用三部曲設(shè)計(jì)方法的DNN加速器案例

微信圖片_20190811222435.jpg

　　圖8. MIT Sze教授團(tuán)隊(duì)設(shè)計(jì)與實(shí)現(xiàn)的系列芯片

　　報(bào)告3：來自DARPA的視角

　　DARPA一直是顛覆式創(chuàng)新的代表，它孕育了很多對(duì)人類產(chǎn)生巨大影響的項(xiàng)目，比如Internet、GPS等。在半導(dǎo)體領(lǐng)域，MPW模式/Fabless模式都是在DARPA資助的項(xiàng)目中孕育出來的。因此DARPA的視角也值得關(guān)注。

　　這次報(bào)告的是項(xiàng)目主管Serge Leef，他之前一直在工業(yè)界，已經(jīng)有豐富的芯片領(lǐng)域經(jīng)驗(yàn)。他的報(bào)告介紹了如何自動(dòng)化實(shí)現(xiàn)芯片安全。除了傳統(tǒng)大家知道的芯片架構(gòu)安全，他還專門強(qiáng)調(diào)了供應(yīng)鏈安全，這也反映了美國在對(duì)華為禁運(yùn)的同時(shí)，其實(shí)也在擔(dān)心有一天禁運(yùn)的板子打到自己身上。

　　這個(gè)報(bào)告并沒有包含具體的技術(shù)，但給人印象深刻的是Serge從整個(gè)業(yè)界生態(tài)角度來分析技術(shù)的價(jià)值——他提到降低芯片設(shè)計(jì)門檻不僅僅是一個(gè)技術(shù)問題，也將促進(jìn)風(fēng)投和創(chuàng)業(yè)，從而推動(dòng)行業(yè)的創(chuàng)新(圖9與圖10)。對(duì)于這一點(diǎn)我深表贊同，自己也曾寫過一篇從經(jīng)濟(jì)學(xué)角度分析開源芯片的文章《駁“發(fā)展開源芯片弊大于利”論》。我曾經(jīng)看過其他DARPA的材料，也都能看到類似這種跳出技術(shù)本身、從更宏觀的角度分析的思路，很值得學(xué)習(xí)。

微信圖片_20190811222433.jpg

　　圖9. 傳統(tǒng)初創(chuàng)企業(yè)Seed/A輪/B輪融資額度穩(wěn)步提升，但芯片初創(chuàng)企業(yè)A輪就需要2000萬美元

微信圖片_20190811222431.jpg

　　圖10. DARPA希望能將芯片設(shè)計(jì)門檻降下來，促進(jìn)風(fēng)投和初創(chuàng)行業(yè)，推動(dòng)創(chuàng)新

　　ERI自從2017年啟動(dòng)以來，其資助的研究內(nèi)容越來越成體系。下圖是DARPA ERI項(xiàng)目所資助的21個(gè)項(xiàng)目一覽圖。DARPA每年也會(huì)在7月份舉辦ERI Summit，將這些項(xiàng)目的核心成員們召集研討進(jìn)展與下階段工作。值得一提的是ERI Summit的報(bào)告材料都是可以公開下載，這是2018年的日程與報(bào)告下載地址：[http://eri-summit.com/agenda]

微信圖片_20190811222429.jpg

　　圖11. DARPA ERI項(xiàng)目所資助的21個(gè)項(xiàng)目一覽圖

　　報(bào)告4：高效開源EDA工具鏈已在路上（OpenROAD）

　　UCSD的Andrew Kahng教授獲得了DARPA項(xiàng)目的資助，開展高效開源EDA工具鏈的研究。他認(rèn)為EDA以前是關(guān)注質(zhì)量，但現(xiàn)在該開始關(guān)注把易用性了。他參與的DARPA IDEA項(xiàng)目目標(biāo)非常激進(jìn)——24小時(shí)內(nèi)全自動(dòng)地完成IP、SoC芯片、PCB版的設(shè)計(jì)（圖12）。

　　在DARPA的資助下，他帶領(lǐng)團(tuán)隊(duì)啟動(dòng)了OpenROAD項(xiàng)目，該項(xiàng)目將從四個(gè)維度來應(yīng)對(duì)芯片設(shè)計(jì)復(fù)雜度問題：（1）最大化劃分，將大的設(shè)計(jì)盡可能劃分為小模塊，這樣可以兩個(gè)好處，一方面是降低算法復(fù)雜度，另一方面就是更易挖掘并行性；（2）并行優(yōu)化，這一點(diǎn)與前面最大化劃分密切聯(lián)想，當(dāng)存在大量并行度時(shí)，就可以采用各種加速并行的技術(shù)來優(yōu)化，包括使用GPU來加速；（3）采用機(jī)器學(xué)習(xí)的工具與流程，傳統(tǒng)芯片設(shè)計(jì)流程中有很多經(jīng)驗(yàn)規(guī)則，這一點(diǎn)可以通過訓(xùn)練大量已有設(shè)計(jì)變成神經(jīng)網(wǎng)絡(luò)模型，從而加速最優(yōu)電路設(shè)計(jì)的搜索和預(yù)測(cè)。這方面也是Kahng教授在報(bào)告中特別強(qiáng)調(diào)的；（4）受限的布局方案也可以減少布局布線時(shí)的算法復(fù)雜度。

　　OpenRoad將于今年推出Alpha版，然后在2020年推出v1.0版本。

微信圖片_20190811222428.jpg

　　圖12. DARPA IDEA項(xiàng)目的目標(biāo)是全自動(dòng)化（無人干預(yù)）、24小時(shí)完成全系統(tǒng)硬件設(shè)計(jì)

微信圖片_20190811222425.jpg

　　圖13. OpenRoad在四方面進(jìn)行優(yōu)化

微信圖片_20190811222423.jpg

　　圖14. OpenRoad將于今明兩年開源

　　EDA是國內(nèi)芯片設(shè)計(jì)產(chǎn)業(yè)最大的軟肋，中國的EDA工具企業(yè)始終未能做大做強(qiáng)。如今，美國開始將EDA轉(zhuǎn)向開源，中國又應(yīng)該如何應(yīng)對(duì)？這個(gè)問題值得認(rèn)真研究。我自己的觀點(diǎn)是開源總體對(duì)中國是有利的，但開源也存在競(jìng)爭(zhēng)，只有更多的投入、參與和貢獻(xiàn)，才能在開源社區(qū)中起到主導(dǎo)作用。中國不一定能在所有環(huán)節(jié)上都存在優(yōu)勢(shì)，但還是有可能在某些環(huán)節(jié)上推出有競(jìng)爭(zhēng)力的開源EDA工具。

微信圖片_20190811222421.jpg

　　圖15. 全世界范圍內(nèi)開源EDA工具出現(xiàn)快速增長趨勢(shì)

　　報(bào)告5：中國的聲音

　　我是這屆遠(yuǎn)景研討會(huì)上唯一一位來自美國以外的報(bào)告人，這也反映了美國在這個(gè)方向上處于絕對(duì)領(lǐng)先地位。我的報(bào)告題目是“The Four Steps to An Open-Source Chip Ecosystem”，根據(jù)過去幾年在開源芯片與敏捷開放領(lǐng)域的一些實(shí)踐，梳理了構(gòu)建開源芯片生態(tài)所需要突破的四個(gè)方面：開源ISA/IP/SoC、開源EDA工具鏈、高效低成本的仿真驗(yàn)證、系統(tǒng)軟件。然后對(duì)每一部分的現(xiàn)狀和未來努力方向進(jìn)行了分析。

微信圖片_20190811222420.jpg

　　圖16. 構(gòu)建開源芯片生態(tài)所需要突破的四個(gè)要素

　　報(bào)告6：CHIPS聯(lián)盟與開源UVM驗(yàn)證框架

　　來自Google的Richard Ho博士介紹了CHIPS聯(lián)盟——這是近期Google聯(lián)合了6家企業(yè)成立了一個(gè)開源芯片聯(lián)盟，旨在推動(dòng)開源芯片生態(tài)（圖17）。這7家企業(yè)每一家都貢獻(xiàn)了開源芯片設(shè)計(jì)中所需要的功能模塊，例如西部數(shù)據(jù)的SweRV核、SiFive的Rocket核、Google的RISC-V-DV驗(yàn)證工具等。從圖18可以看到，越來越多的開源工具開始出現(xiàn)，未來基于全開源EDA工具設(shè)計(jì)開源芯片，將不會(huì)是空談。

微信圖片_20190811222418.jpg

　　圖17. CHIPS聯(lián)盟旨在推動(dòng)開源芯片生態(tài)

微信圖片_20190811222416.jpg

　　圖18. 越來越多的開源工具開始出現(xiàn)

　　Google開源了一個(gè)面向RISC-V的驗(yàn)證框架（圖19），可以通過RISC-V-DV來產(chǎn)生指令流，對(duì)設(shè)計(jì)進(jìn)行壓力測(cè)試。芯片設(shè)計(jì)過程中的驗(yàn)證環(huán)境非常耗時(shí)耗力，但又是極其重要的環(huán)節(jié)。應(yīng)該說Google的這個(gè)開源工具確實(shí)芯片設(shè)計(jì)中的痛點(diǎn)，但如何能靈活應(yīng)對(duì)不同的設(shè)計(jì)，如何能達(dá)到更高的性能，這些都還需要不斷優(yōu)化。

微信圖片_20190811222414.jpg

　　圖19. Google開源的針對(duì)RISC-V的驗(yàn)證框架

　　報(bào)告7：硬件加速器設(shè)計(jì)與領(lǐng)域?qū)Ｓ谜Z言DSL

　　美國工程院院士、斯坦福大學(xué)的Mark Horowitz教授介紹了他們?cè)诩铀倨黝I(lǐng)域的工作。Horowitz教授早期參與了很多多處理器架構(gòu)、高帶寬內(nèi)存的研究，創(chuàng)辦了Rambus公司。在這個(gè)報(bào)告中，他認(rèn)為設(shè)計(jì)一個(gè)硬件加速器的本質(zhì)就是將應(yīng)用快速地映射到硬件上，這可以分解為三個(gè)步驟（圖20）：（1）用領(lǐng)域?qū)Ｓ谜Z言DSL來寫應(yīng)用；（2）用編譯器將應(yīng)用映射到可編程的硬件模型（也可以看作某種粒度的ISA）上；（3）將ISA映射到目標(biāo)硬件上。

　　Horowitz教授接著介紹了團(tuán)隊(duì)正在開發(fā)的AHA工具鏈，融合了上述三個(gè)步驟（圖21）。報(bào)告非常精彩的部分是他坦言到雖然這套工具鏈能工作，也開發(fā)出了芯片，但還存在很大的問題，整個(gè)工具鏈需要重構(gòu)。然后他總結(jié)了6個(gè)經(jīng)驗(yàn)教訓(xùn)：（1）敏捷開發(fā)應(yīng)該關(guān)注系統(tǒng)構(gòu)建，而不僅僅是加速器的性能，用戶關(guān)心的應(yīng)用最終性能；（2）硬件設(shè)計(jì)不只是功能，還包括很多復(fù)雜問題，如時(shí)序、布局、測(cè)試生成等，這些都不應(yīng)該暴露給用戶，因此可以通過DSL+編譯器來為用戶屏蔽這些底層細(xì)節(jié)；（3）用戶使用加速器時(shí)都會(huì)重寫應(yīng)用代碼，既然需要重寫，從一開始就應(yīng)該讓用戶使用DSL；（4）用戶希望為一類應(yīng)用設(shè)計(jì)加速器，而不是僅僅為一個(gè)應(yīng)用，因此粗粒度可重構(gòu)架構(gòu)CGRA是很好的選擇；（5）敏捷開發(fā)的核心是重用，因此要盡可能設(shè)計(jì)一些新工具提供重用度；（6）開源硬件可以降低NRE成本，降低維護(hù)成本，但開源硬件的形式不一定是硬件，而將會(huì)是以軟件工具或代碼的形式。

　　Horowitz教授的這幾點(diǎn)經(jīng)驗(yàn)教訓(xùn)具有很強(qiáng)的啟發(fā)性，也很具有可操作性，他們團(tuán)隊(duì)的工作值得關(guān)注。

微信圖片_20190811222409.jpg

　　圖20. 硬件加速器的本質(zhì)就是將應(yīng)用快速地映射到硬件

微信圖片_20190811222406.jpg

　　圖21. 斯坦福大學(xué)開發(fā)的芯片敏捷開發(fā)AHA工具鏈

　　報(bào)告8：高層次綜合

　　美國工程院院士、UCLA的Jason Cong教授是FPGA與高層次綜合HLS（High-Level Synthesis）領(lǐng)域的頂尖專家。HLS是從1980年代FPGA興起時(shí)CMU、IBM等就開始研究，但一直未能形成商用。從2006年開始，Cong教授在UCLA啟動(dòng)了xPilot項(xiàng)目，后成立公司AutoESL推出AutoPilot工具，并于2011年被Xilinx收購集成為Vivado HLS工具。在報(bào)告中，Cong教授指出HLS還面臨兩大挑戰(zhàn)（圖22）：

　?。?）需要花大力氣對(duì)代碼重構(gòu)才能達(dá)到好的性能，簡單的C代碼在綜合得到硬件后甚至可能比CPU性能慢上百倍（圖23）。Cong教授團(tuán)隊(duì)認(rèn)為可通過編譯優(yōu)化技術(shù)來解決這個(gè)問題，因此開發(fā)了一個(gè)編譯器Merlin，簡化代碼重構(gòu)工作。體系結(jié)構(gòu)設(shè)計(jì)的“三大法寶”為并行、流水和緩存。Merlin編譯器的目標(biāo)是將“三大法寶”對(duì)應(yīng)的設(shè)計(jì)規(guī)則集成到編譯器中，從而在整個(gè)過程中減少人的參與。

　?。?）如何在很大的設(shè)計(jì)空間中找到優(yōu)化設(shè)計(jì)也是一個(gè)很大的挑戰(zhàn)。前面提到體系結(jié)構(gòu)層次有“三大法寶”，而在具體設(shè)計(jì)時(shí)每一個(gè)法寶都有很多種選擇，因此設(shè)計(jì)空間很大。這個(gè)挑戰(zhàn)不僅僅是學(xué)術(shù)界關(guān)心，事實(shí)上工業(yè)界也很關(guān)心，我們和海思技術(shù)交流中也提到這點(diǎn)。為了應(yīng)對(duì)這個(gè)問題，Cong教授團(tuán)隊(duì)開發(fā)了一套自動(dòng)化設(shè)計(jì)空間探索框架（Automated design space exploration framework）。目前還主要是基于梯度進(jìn)行空間搜索，這方面還有很大的優(yōu)化空間。

微信圖片_20190811222403.jpg

　　圖22. 高層次綜合HLS面臨的兩大挑戰(zhàn)

微信圖片_20190811222401.jpg

　　圖23. C代碼需要重構(gòu)才能獲得加速，否則可能會(huì)比CPU慢上百倍

　　Cong教授認(rèn)為讓程序員來寫HLS代碼效率太低，應(yīng)該提供更高抽象的語言，即領(lǐng)域?qū)Ｓ玫恼Z言DSL——程序員用更高級(jí)的DSL來寫代碼，然后自動(dòng)生成HLS代碼，進(jìn)而映射到FPGA上（圖24）。到這里可以看出這個(gè)技術(shù)思路與斯坦福Horowitz教授提出的三個(gè)步驟一致，如果接著往下看，也會(huì)發(fā)現(xiàn)第10個(gè)來自Berkeley的報(bào)告也是同樣的理念。

微信圖片_20190811222400.jpg

　　圖24. DSL能提高HLS開發(fā)效率

　　報(bào)告9：英偉達(dá)的敏捷開發(fā)實(shí)踐

　　英偉達(dá)ASIC與VISL研究部門主任Brucek Khailany介紹了他們采用機(jī)器學(xué)習(xí)方法的敏捷開發(fā)技術(shù)。英偉達(dá)積極投入芯片敏捷開發(fā)，其動(dòng)力也是因?yàn)楝F(xiàn)在芯片設(shè)計(jì)太過復(fù)雜。例如，英偉達(dá)產(chǎn)品的開發(fā)周期一般需要3-5年，其中設(shè)計(jì)與驗(yàn)證的時(shí)間與成本占比大約70%（圖25），2018年Nvidia Xavier SoC一共花了8000人年！因此英偉達(dá)希望能將開發(fā)周期與成本降低一個(gè)數(shù)量級(jí)。

　　英偉達(dá)的總體思路包含三個(gè)要點(diǎn)（圖26）：（1）使用更高級(jí)的開發(fā)語言，英偉達(dá)選擇的是C++；（2）利用HLS工具將C++代碼轉(zhuǎn)變?yōu)镽TL代碼，從而可以嫁接到現(xiàn)有的ASIC開發(fā)流程；（3）充分使用已經(jīng)開發(fā)好的庫和生成器（libraries/generator），盡可能地重用已有設(shè)計(jì)從而節(jié)省時(shí)間。值得一提的是，第（3）點(diǎn)庫和生成器是面向領(lǐng)域?qū)Ｓ玫男酒艚蓍_發(fā)方法中很重要的環(huán)節(jié)，未來將會(huì)決定芯片敏捷開發(fā)的性能與質(zhì)量。最近這方面的工作也開始增加，比如英偉達(dá)開發(fā)的MatchLib，Berkeley開發(fā)的面向RISC-V的Rocket Chip Generator和面向模擬電路的Analogy Generator（下一章節(jié)將會(huì)介紹）。

　　最后Khailany簡要總結(jié)了將機(jī)器學(xué)習(xí)應(yīng)用到芯片設(shè)計(jì)自動(dòng)化方面的相關(guān)工作（圖27）。如之前Cong教授報(bào)告中提到，設(shè)計(jì)自動(dòng)化中面臨的挑戰(zhàn)之一便是巨大的設(shè)計(jì)空間。深度學(xué)習(xí)在大空間高效搜索方面則具有很大的潛力。

微信圖片_20190811222358.jpg

　　圖25. 英偉達(dá)產(chǎn)品開發(fā)周期需要3-5年，設(shè)計(jì)與驗(yàn)證占比大約70%

微信圖片_20190811222357.jpg

　　圖26. 敏捷開發(fā)思路三個(gè)要點(diǎn)：高層次語言、工具、庫/生成器

微信圖片_20190811222355.jpg

　　圖27. 機(jī)器學(xué)習(xí)為敏捷開發(fā)帶來的機(jī)遇

　　報(bào)告10：支持硬件敏捷開發(fā)的新語言與生成器

　　Berkeley的 Borivoje Nikoli? 教授的核心觀點(diǎn)是生成器（generator）將是芯片敏捷開發(fā)的核心（圖28），可以降低芯片設(shè)計(jì)的成本和開發(fā)周期。生成器技術(shù)和軟件開發(fā)中的面向?qū)ο笏枷胗泻芏嘞嗤ㄖ?，generator可以看作是一個(gè)class。簡單總結(jié)一下這種方式的好處：（1）重用度高，一個(gè)生成器可產(chǎn)生很多實(shí)例；（2）更易定制化，可通過修改參數(shù)產(chǎn)生不同的實(shí)例；（3）便于驗(yàn)證，理論上對(duì)生成器充分驗(yàn)證（包括形式化驗(yàn)證），可以保障生成實(shí)例的正確性。

　　Nikoli?教授帶領(lǐng)團(tuán)隊(duì)過去幾年在這方面做出了杰出的貢獻(xiàn)。他們發(fā)明了具備更高抽象能力的Chisel語言，使生成器的開發(fā)變得更簡單。事實(shí)上，近年來非常火的RISC-V最早開源實(shí)現(xiàn)Rocket Chip實(shí)現(xiàn)就是一個(gè)基于Chisel的生成器（圖31）。

　　一款SoC芯片設(shè)計(jì)很大的挑戰(zhàn)是模擬電路。Nikoli?教授開發(fā)了BAG（Berkeley Analog Generator），一套基于Python的開源模擬電路生成器（圖29），包括 Comparator 、多種ADC/DAC生成器、SerDes生成器（圖30）等。這些生成器在ST 28nm, GF 22nm, TSMC 16nm等不同工藝下成功流片。當(dāng)然目前實(shí)測(cè)性能與業(yè)界主流產(chǎn)品相比還有差距，比如使用TSMC 16nm工藝的ADC采樣頻率為7GS/s，精度為6.5bit，而ADI公司于2017年便開發(fā)出基于28nm工藝的10GS/s、精度為12bit的產(chǎn)品。但值得一提的是這些都是開源設(shè)計(jì)，如果社區(qū)和企業(yè)在此基礎(chǔ)上不斷優(yōu)化改進(jìn)，有可能最終得到足夠性能的開源模擬電路設(shè)計(jì)。

微信圖片_20190811222350.jpg

　　圖28. 生成器（generator）是芯片敏捷開發(fā)的核心

微信圖片_20190811222348.jpg

　　圖29. 數(shù)字電路生成器Chisel3和模擬電路生成器BAG2

微信圖片_20190811222339.jpg

　　圖30. 基于BAG2的SerDes生成器

微信圖片_20190811222303.jpg

　　圖31. 基于Chisel與BAG生成的RISC-V芯片

　　報(bào)告11：端到端的形式化驗(yàn)證

　　形式化驗(yàn)證（Formal Verification）方法被認(rèn)為是保證系統(tǒng)正確性的最有效方法。自從2009年第一個(gè)經(jīng)過形式化驗(yàn)證的操作系統(tǒng)內(nèi)核SeL4發(fā)表以來，形式化驗(yàn)證方法已收到越來越多地關(guān)注，尤其是在操作系統(tǒng)領(lǐng)域。2016年，美國NSF在計(jì)算機(jī)領(lǐng)域額度最大的“Expedition in Computing”項(xiàng)目（5年1000萬美元）資助了由普林斯頓大學(xué)、麻省理工學(xué)院、康奈爾大學(xué)、賓夕法尼亞大學(xué)聯(lián)合申請(qǐng)的形式化驗(yàn)證軟硬件全系統(tǒng)棧的項(xiàng)目：DeepSpec（圖32），一個(gè)目標(biāo)極其遠(yuǎn)大而具有顛覆性、同時(shí)也極具挑戰(zhàn)的研究項(xiàng)目。

　　MIT的Adam Chlipala教授也是DeepSpec的co-PI，他在Visioning Workshop上介紹了基于RISC-V開展的全系統(tǒng)端到端強(qiáng)形式化驗(yàn)證研究進(jìn)展（圖33），包括硬件RTL層次的驗(yàn)證、編譯器的驗(yàn)證等。Chlipala教授展示了一個(gè)經(jīng)過驗(yàn)證的RISC-V核實(shí)現(xiàn)（圖34，圖35），目前還只能用于演示點(diǎn)燈。

　　報(bào)告中我的理解是相比于傳統(tǒng)的Verilog，具有更高抽象的硬件描述語言（如BlueSpec、Chisel）將有助于RTL層次的形式化驗(yàn)證。不過由于自己對(duì)這個(gè)領(lǐng)域也了解不多，所以也無法更深入地解讀他們的研究工作。

　　在這里可以分享一段有趣的經(jīng)歷：我在普林斯頓大學(xué)做博士后時(shí)在同一個(gè)辦公室的是Andrew Appel教授的博士后Lennart Beringer，當(dāng)時(shí)正在開展編譯器的形式化驗(yàn)證研究。當(dāng)時(shí)曾問過他形式化驗(yàn)證的前景，他自己認(rèn)為可能需要20年才能實(shí)用。讓人感慨的是，幾年后，即使在一線研究人員看來都很遙遠(yuǎn)的研究卻得到了NSF的大力資助，而Lennart現(xiàn)在也正是DeepSpec項(xiàng)目的副主任。相比較于美國大力資助形式化驗(yàn)證的系統(tǒng)實(shí)現(xiàn)，國內(nèi)從事這方面研究的團(tuán)隊(duì)就顯得太少了，也很難得到資助。這種現(xiàn)狀亟需改變。

微信圖片_20190811222256.jpg

　　圖32. 2016年NSF Expedition in Computing項(xiàng)目：DeepSpec

微信圖片_20190811222253.jpg

　　圖33. 端到端形式化驗(yàn)證框架

微信圖片_20190811222249.jpg

　　圖34. RISC-V核的形式化驗(yàn)證示例

微信圖片_20190811222246.jpg

　　圖35. 經(jīng)過驗(yàn)證的RISC-V核

　　中國的挑戰(zhàn)與機(jī)遇

　　芯片一直是中國半導(dǎo)體產(chǎn)業(yè)的軟肋，如何破解中國半導(dǎo)體產(chǎn)業(yè)面臨的“卡脖子”問題，各界都在積極實(shí)踐與探索。

　　中國當(dāng)前需要盡快突破被稱為是“燃眉之急”的多項(xiàng)關(guān)鍵技術(shù)，但從長遠(yuǎn)來看，中國芯片領(lǐng)域面臨的 “卡脖子”問題根源在于優(yōu)秀人才儲(chǔ)備嚴(yán)重不足——我們?cè)鲞^一項(xiàng)統(tǒng)計(jì)，2008到2017年的十年間體系結(jié)構(gòu)頂會(huì)ISCA論文的第一作者（可認(rèn)為是芯片架構(gòu)研究優(yōu)秀人才）85%選擇在美國就業(yè)，僅有4%在中國就業(yè)，差距巨大（圖36）。這與當(dāng)前芯片設(shè)計(jì)門檻過高，導(dǎo)致中國大學(xué)無法開展芯片相關(guān)教學(xué)與研究密切相關(guān)。

　　這種人才危機(jī)美國也曾經(jīng)歷過，1982年全美上千所大學(xué)中只有不到100 位教授和學(xué)生從事半導(dǎo)體相關(guān)的研究。為了應(yīng)對(duì)人才危機(jī)，美國DARPA在1981年啟動(dòng)MOSIS項(xiàng)目，為大學(xué)提供流片服務(wù)，通過MPW模式大幅降低芯片設(shè)計(jì)門檻（圖37）。三十余年來MOSIS為大學(xué)和研究機(jī)構(gòu)流了60000多款芯片，培養(yǎng)了數(shù)萬名學(xué)生。因此，降低芯片設(shè)計(jì)門檻亦可大幅提高人才培養(yǎng)效率。

　　開源芯片與敏捷開發(fā)，有可能再未來實(shí)現(xiàn)數(shù)量級(jí)地降低芯片開發(fā)門檻。開源芯片生態(tài)仍處于起步階段，如果中國能積極參與并主導(dǎo)開源芯片生態(tài)中若干核心模塊，那么就有可能吸引更多開發(fā)人員、民間資本參與芯片開發(fā)，提高芯片領(lǐng)域的創(chuàng)新活力，同時(shí)也能為中國芯片企業(yè)提供基于開源的芯片關(guān)鍵技術(shù)與優(yōu)秀人才、擺脫“卡脖子”困境。

微信圖片_20190811222242.jpg

　　圖36. “卡脖子”問題根源在于優(yōu)秀人才儲(chǔ)備嚴(yán)重不足

微信圖片_20190811222240.jpg

　　圖37. 美國應(yīng)對(duì)半導(dǎo)體人才危機(jī)的方式

　　結(jié)語：2030憧憬

　　總結(jié)來說，開源芯片與敏捷開發(fā)備受關(guān)注，背后存在兩方面的驅(qū)動(dòng)力：

　?。?）應(yīng)對(duì)摩爾定律終結(jié)的技術(shù)發(fā)展需求：Dennard Scaling定律和摩爾定律逐漸走向終結(jié)，但摩爾定律賦予芯片的能力并未充分挖掘出來。例如實(shí)現(xiàn)一個(gè)矩陣乘法，普通程序員寫的程序和懂體系架構(gòu)的專家寫的程序性能上甚至?xí)?3000倍的差距。因此，面向某個(gè)特定領(lǐng)域?qū)＜抑R(shí)實(shí)現(xiàn)到芯片中，就有可能提升幾百甚至幾千倍的性能功耗比，從而充分挖掘芯片上晶體管的潛力。但這種領(lǐng)域?qū)Ｓ皿w系結(jié)構(gòu)（DSA）會(huì)帶來碎片化問題，需要從芯片設(shè)計(jì)成本與周期兩個(gè)維度同時(shí)降低門檻，才能應(yīng)對(duì)種類繁多的領(lǐng)域?qū)Ｓ眉铀倨鳌?/p>

　?。?）激發(fā)創(chuàng)新活力、繁榮芯片產(chǎn)業(yè)的市場(chǎng)需求：長期以來芯片研發(fā)成本高、周期長，導(dǎo)致了該領(lǐng)域的高門檻，嚴(yán)重阻礙了創(chuàng)新。即使研制一款中檔芯片，也往往需要數(shù)百人年、數(shù)千萬甚至上億的研發(fā)投入，導(dǎo)致資本不愿投資。因此，只有少數(shù)企業(yè)才能承擔(dān)，資本市場(chǎng)對(duì)芯片投資也是極其謹(jǐn)慎保守，制約了芯片領(lǐng)域的創(chuàng)新活力。

　　構(gòu)建開源芯片生態(tài)與敏捷開發(fā)方法一個(gè)長期的系統(tǒng)工程，面臨著諸多挑戰(zhàn)，但也是一個(gè)不管是學(xué)術(shù)上還是商業(yè)上都值得探索的方向，也需要各界的支持與參與。

　　后記：IEEE MICRO特刊

　　Visioning Workshop結(jié)束后的第二天，IEEE MICRO雜志的主編和編委聯(lián)系到我。他們也在現(xiàn)場(chǎng)聽了報(bào)告，認(rèn)為這個(gè)方向很重要，邀請(qǐng)我來組織一期關(guān)于敏捷開發(fā)與開源硬件的特刊，我欣然接受。經(jīng)過前期的一些討論，現(xiàn)在已經(jīng)確定了幾個(gè)時(shí)間節(jié)點(diǎn)，Call-for-Paper也已出爐。歡迎大家賜稿！

微信圖片_20190811222234.jpg

　　圖38. Call-for-Paper of IEEE Micro Special Issue

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請(qǐng)及時(shí)通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

关于芯片产业的未来，专家是这样看的！

日期： 2019-08-11

相關(guān)內(nèi)容