隨著AI、5G通信以及云計算等專用計算領(lǐng)域的發(fā)展,面向?qū)S糜嬎泐I(lǐng)域的計算機體系結(jié)構(gòu)也進入了新的黃金時代。描繪這一黃金時代的兩支重要畫筆就是開源硬件(芯片)與敏捷開發(fā):開源可降低芯片設(shè)計門檻,敏捷設(shè)計能縮短開發(fā)周期。
開源指令集RISC-V引發(fā)了開源硬件的熱潮。但芯片的設(shè)計和生產(chǎn)流程比軟件更長,需要更多工具和流程,EDA也開始轉(zhuǎn)向依靠開源社區(qū)的模式來解決復(fù)雜的設(shè)計難題,同時降低開發(fā)成本。但國內(nèi)EDA技術(shù)一直是一項軟肋,本土EDA企業(yè)尚未發(fā)展壯大,該如何應(yīng)對開源EDA這一新的技術(shù)形態(tài)與生態(tài)模式呢?這些問題在5月14日下午召開的中國計算機學(xué)會青年精英大會(YEF2021)技術(shù)論壇【芯片智造——敏捷設(shè)計與開源EDA之路】上展開了激烈的討論。
開源芯片成發(fā)展新趨勢
說到開源芯片,RISC-V可謂是開源的代表。去年RISC-V國際基金會將總部搬往瑞士,目前其已有超過1000個會員,企業(yè)機構(gòu)約200家。中國在這里面占據(jù)很重要的作用,中國企業(yè)占比超過20%,而且19個理事會成員中有9個來自中國。
隨著開放指令集RISC-V逐漸受到業(yè)界追捧,開源芯片的概念逐漸進入人們的視野,并受到全世界的關(guān)注與投入。國際上,早在2019年國際計算機體系結(jié)構(gòu)旗艦會議ISCA的遠景研討會上,包括圖靈獎得主David Patterson教授在內(nèi)的多位美國工程院院士,以及來自MIT、UC Berkeley、UCSD、Stanford、Google、Nvidia、DARPA等頂尖大學(xué)、企業(yè)和政府機構(gòu)的專家就聚焦討論了“面向下一代計算的敏捷開放硬件”的前沿?zé)狳c,涉及到內(nèi)容包括指令集、EDA工具鏈開源、設(shè)計流程、高層次綜合、形式化驗證。
看向國內(nèi),“十四五”規(guī)劃也已開始對開源芯片布局,“十四五”規(guī)劃第五篇第十五章第一節(jié)中提到,支持數(shù)字技術(shù)開源社區(qū)等創(chuàng)新聯(lián)合體發(fā)展,完善開源知識產(chǎn)權(quán)和法律體系,鼓勵企業(yè)開放軟件源代碼、硬件設(shè)計和應(yīng)用服務(wù)。
那么開源芯片有哪些創(chuàng)新機會呢?中國科學(xué)院計算技術(shù)研究所副所長包云崗在技術(shù)論壇上講到:RISC-V屬于指令集開放,其實是指令集手冊的開放,如英特爾CPU的指令集手冊有5000多頁,ARM CPU的指令集手冊有2000多頁,而RISC-V的指令集手冊只有200多頁。如果把指令集變成真正的架構(gòu),此時就會產(chǎn)生諸多設(shè)計文檔,那么文檔可以公開;根據(jù)設(shè)計文檔再變成源代碼,源碼也可以公開;EDA工具鏈可以將開源代碼再變成芯片版圖,那么EDA設(shè)計工具也可以開源。
他總結(jié),開源芯片主要包含有三個層次:(1)指令集(2)處理器微架構(gòu)設(shè)計/實現(xiàn)(3)設(shè)計流程/工具。
在這三個層次中,除了指令集,芯片設(shè)計的工具也很重要。EDA工具是開源芯片設(shè)計體現(xiàn)的基石,如今多種開源EDA工具基本覆蓋了芯片設(shè)計中的模擬仿真、邏輯綜合、布局布線、物理實現(xiàn)和簽核等功能。
眾所周知,全球EDA市場被三大廠商Cadence、Synopsys、Mentor(2021年1月更名為:Siemens EDA,即西門子EDA)壟斷。他們的規(guī)模大,產(chǎn)品線完整,可以提供全流程的完整解決方案。相反,國內(nèi)EDA工具在中國的市場份額不到5%,在全球的市場份額僅為0.2%。而且國內(nèi)EDA公司規(guī)模小,產(chǎn)品單一,多是“點”工具,只能提供局部解決方案。單一EDA工具很難滿足設(shè)計人員對于IC設(shè)計的全流程需求,不同工具間的切換又為數(shù)據(jù)完整性增添了風(fēng)險。于是日前市場對于開源平臺的呼聲日益增高。
開源EDA很重要,但難題亦很多
鵬城實驗室、中科院計算所的解壁偉認為,開源EDA是支撐開放芯片生態(tài)的重要保障。多個成功經(jīng)驗表明,開源開放是構(gòu)建繁榮的技術(shù)生態(tài)和產(chǎn)業(yè)生態(tài)的必要基礎(chǔ)。如Linux操作系統(tǒng),支撐了整個開源生態(tài)體系;再比如Android移動操作系統(tǒng),雖然現(xiàn)在已經(jīng)閉源,但當(dāng)年以開源為起點,統(tǒng)一了除iOS外的整個移動互聯(lián)網(wǎng)生態(tài);在人工智能領(lǐng)域,Caffe、TensorFlow、Pytorch、PaddlePaddle可以說是整個AI技術(shù)生態(tài)體系的基石。
開源EDA工具可以降低芯片設(shè)計門檻,如降低芯片設(shè)計的人力、IP、EDA成本。還能為開展EDA領(lǐng)域的基礎(chǔ)科學(xué)研究和人才培養(yǎng),無論是對企業(yè)、高校、學(xué)術(shù)科研機構(gòu)還是芯片和EDA方向的個人愛好者而言,都能提供很好的思路。如果開源EDA可以集合多方力量,將有助于我國加速追趕國際先進水平。
然而,我國EDA軟件的基礎(chǔ)還相對薄弱,在開源領(lǐng)域幾近空白。開源EDA仍然面臨諸多挑戰(zhàn):用戶少、貢獻者少以及框架結(jié)構(gòu)不清晰;論壇上也討論了一些解決方案。具體如下:
?。ㄒ唬┯脩羯伲洪_源EDA工具質(zhì)量相比商業(yè)工具有較大差距,用戶數(shù)量非常有限。解決方案是提升工具質(zhì)量,強調(diào)生產(chǎn)環(huán)境下的項目檢驗,即開源EDA工具不能只停留在學(xué)術(shù)論文和軟件代碼,要與其他點工具共同匯聚成工具鏈,支撐完整的芯片流片驗證,產(chǎn)生有效的用戶反饋。如美國的Magic就經(jīng)過了數(shù)次流片驗證,論文就有實際芯片測試數(shù)據(jù)。
?。ǘ┴暙I者少:EDA領(lǐng)域相對小眾,其開源社區(qū)更是人丁單薄,Yosys、abc、magic、OpenROAD等開源工具的主要貢獻者大多在10余人左右。由于EDA學(xué)科的特點,開源EDA貢獻者需要同時具備CS、Math、EE和MicroE的知識,技術(shù)門檻較高。每個開源EDA工具的開發(fā)并不開放,基本是某個學(xué)校、研究機構(gòu)和公司的內(nèi)部團隊,外部參與者很少、也很難參與。解決方法是充分拆解、抽象和描述EDA技術(shù)問題,并分類轉(zhuǎn)化到數(shù)學(xué)、算法和高性能等專業(yè)領(lǐng)域能夠理解的語言表述,發(fā)動多個學(xué)科的社區(qū)力量。
?。ㄈ┛蚣芙Y(jié)構(gòu)不清晰:代碼不統(tǒng)一且復(fù)用率低是開源軟件的一項通病,然而開源EDA工具與算法強綁定,問題更為突出。設(shè)計新算法通常需要大量重寫代碼,失去了開源的意義。解決方案有二。第一,模塊化設(shè)計,從基礎(chǔ)框架設(shè)計出發(fā),再深入到算法層,抽象共有操作和數(shù)據(jù)格式,從代碼中探索出迭代重構(gòu)規(guī)律,形成精簡高效和模塊化的基礎(chǔ)框架。這種模塊化設(shè)計還便于用分布式并行計算架構(gòu)進行EDA設(shè)計流程的加速。第二,規(guī)范化抽象,用Multi-level Intermediate Representation(MLIR)等優(yōu)秀的編譯器設(shè)計理念對整個設(shè)計流程(尤其是前端設(shè)計)進行多個抽象層次的劃分,便于各個領(lǐng)域?qū)<覍W⒂诟髯缘某橄髮哟?,同時通過多個層次的編譯打通EDA工具鏈,完成敏捷方便的全流程驗證。這樣,即使一個點工具也可以通過規(guī)范的轉(zhuǎn)換格式,靈活的接入到開源的EDA工具鏈中,完整地驗證自己所開發(fā)工具的性能和質(zhì)量。目前,北美產(chǎn)業(yè)界和學(xué)術(shù)界正在形成這種趨勢。
落實到開源EDA項目來說,無論從低工藝(110nm)至高工藝(55nm,40nm甚至28nm)。從高校教學(xué)級應(yīng)用到企業(yè)產(chǎn)品級應(yīng)用,從小規(guī)模ASIC芯片到更大規(guī)模的SoC項目,都應(yīng)堅持研用結(jié)合的策略,以實用為牽引,以用帶研,研以致用。從工具鏈、點工具、基準測試集、示范應(yīng)用以及工業(yè)級開源工藝庫等五大方面逐個擊破。
業(yè)界的研究進展
值得一提的是,在ASPLOS 2021大會上,剛剛從Google Brain跳槽到明星RISC-V公司SiFive的Chris Lattner博士(LLVM 項目的主要發(fā)起人與作者之一, Clang編譯器的作者)做了The Golden Age of Compiler Design in an Era of HW/SW Co-design的演講,提出了基于MLIR編譯技術(shù)打造的全新的統(tǒng)一的EDA (Electronic Design Automation)框架,像軟件中的TensorFlow或PyTorch那樣為EDA設(shè)計工具鏈提供完整、靈活的基礎(chǔ)設(shè)施。CIRCT項目與MLIR同源,在硬件設(shè)計和軟件編譯的容易形成生態(tài)一致性。
在開源EDA軟件之路上,國內(nèi)EDA學(xué)術(shù)和產(chǎn)業(yè)都在努力尋找合適的位置為開源EDA做貢獻。
在開源芯片領(lǐng)域,中科院計算所2019年啟動了RISC-V處理器芯片與RISC-V原生操作系統(tǒng)等項目,并且在國產(chǎn)28nm工藝上構(gòu)建具有性價比優(yōu)勢的開源芯片技術(shù)體系。此外,他們還在探索開源EDA設(shè)計開源芯片,基于現(xiàn)有開源工具,構(gòu)建了一套基于Python的RTL到GDSⅡ的設(shè)計流程;去年8月份,國科大五位本科生整整歷時兩年使用開源EDA工具設(shè)計出了果殼-1芯片,并實現(xiàn)了流片。
中科院還研發(fā)了芯片敏捷設(shè)計云平臺AgileServe,該平臺集成了各種開源要素,能支持用戶快速定制處理器芯片與軟件開發(fā),降低芯片設(shè)計門檻。于學(xué)生來說,可以隨時隨地開展芯片設(shè)計;對老師來說,可以實現(xiàn)在線指導(dǎo)學(xué)生。
南京集成電路設(shè)計服務(wù)產(chǎn)業(yè)創(chuàng)新中心有限公司(以下簡稱EDA創(chuàng)新中心)常務(wù)副總經(jīng)理陳剛介紹了以開源的方式來打造國產(chǎn)EDA通用底座(openEDI)??紤]到國內(nèi)的EDA點工具各自獨立,建設(shè)國內(nèi)生態(tài)的通用底座,有望把點工具連接在一起。EDA通用底座的研發(fā)目標是支持所有國產(chǎn)EDA工具,聚合成套的EDA工具鏈,成為國內(nèi)生態(tài)的通用底座。下圖為EDA通用底座架構(gòu)。最下方的部分是數(shù)據(jù)層,承載所有EDA在內(nèi)存及磁盤上的數(shù)據(jù)庫和數(shù)據(jù)模型,其中包括各種解析器的模塊、用戶界面模塊等。上層為通用算法層與計算框架。
北京大學(xué)的林亦波在會上介紹了知名的《深度學(xué)習(xí)輔助布局布線優(yōu)化》項目,他講述了利用深度學(xué)習(xí)來改進傳統(tǒng)的布局布線算法,在這個過程中必須要利用開源的布局布線工具,否則很難獲取深度學(xué)習(xí)樣本。未來他們將繼續(xù)改進算法,提高穩(wěn)定性和泛化能力。預(yù)計可能發(fā)布如ImageNet那樣的開放EDA數(shù)據(jù)集,吸引學(xué)術(shù)界和產(chǎn)業(yè)界的共同競爭與發(fā)展。
東南大學(xué)國家專用集成電路系統(tǒng)工程技術(shù)研究中心的閆浩講述了寬電壓近閾值設(shè)計方法學(xué)研究與開源EDA的進展。他介紹到,EDA工具的技術(shù)挑戰(zhàn)是不斷演進的工藝和蝕刻尺寸帶來的偏差建模以及優(yōu)化算法的開發(fā)。他指出在做研究時,遇到最大的挑戰(zhàn)是需要耗費大量精力復(fù)現(xiàn)別人代碼,因此他們也與如NiiCEDA等國內(nèi)EDA企業(yè)合作,積極投入到開源時序分析工具的開發(fā)中。
寧波大學(xué)的儲著飛分享了在多邏輯域自動綜合工具上的研究進展。他講到,邏輯綜合是在滿足約束條件下,將所有設(shè)計數(shù)字電路的RTL級描述,轉(zhuǎn)化為指定的工藝庫中單元電路的連接。邏輯綜合主要包括三個階段:翻譯、優(yōu)化和工藝映射。他指出,不同的邏輯完備集所發(fā)展而來的綜合方法適用場景不同,現(xiàn)有的這些EDA工具都是基于傳統(tǒng)布爾邏輯發(fā)展而來,新型算符能帶來更多機會,比如基于極性變換的Reed-Muller、TB和RM雙邏輯等。在EDA開源方面,他指出邏輯綜合工具的發(fā)展趨勢:一、AI for EDA,用AI的方法推斷邏輯綜合優(yōu)化變換的順序,讓沒有任何經(jīng)驗的工程師得到一個優(yōu)化腳本;二、EDA for AI,用查找表形式反推邏輯操作,達到與神經(jīng)網(wǎng)絡(luò)訓(xùn)練權(quán)重一樣的目的;三、Optimal Solution,給定一個數(shù)字電路,現(xiàn)有的方法高度依賴SAT求解器獲得如最小節(jié)點個數(shù),最小邏輯深度等最優(yōu)解,但是SAT 求解器本身又是啟發(fā)式算法,通過數(shù)字電路仿真可以輔助SAT進行更高效的搜索;四、Technology Enabler,發(fā)展新的邏輯抽象方法,幫助一些諸如二維材料等新工藝的評估和發(fā)展。無論訓(xùn)練集,搜索優(yōu)化與新模型都將在開源生態(tài)中獲得收益。
開源EDA何去何從?
開源EDA生態(tài)從0到1所面臨諸多困難,如何打通開源EDA的生態(tài)閉環(huán)?如何維護生態(tài)持續(xù)發(fā)展?如何防范流片失敗、IP泄露、專利等生態(tài)風(fēng)險?未來又該何去何從?針對這些問題,在場學(xué)者和專家眾說紛紜,進行了激烈且有意義的討論。
從0到1,開源EDA的生態(tài)從學(xué)術(shù)界開始建設(shè)
跟傳統(tǒng)的開源軟件不同,開源EDA軟件的數(shù)據(jù)結(jié)構(gòu)、代碼質(zhì)量尤其算法的專業(yè)性極高,用戶群體較小,限制了開源社區(qū)的規(guī)模??v觀歷史,硅谷渺如星辰大海的高科技公司都是從高校創(chuàng)新開始做起的。EDA也一樣,首先在高校培養(yǎng)開源EDA的第一批用戶群體,包括老師和學(xué)生,讓他們通過創(chuàng)新的形式先把開源工具用起來,然后通過不斷的使用和迭代改進工具,在將來達到可用的程度。
然而,從學(xué)術(shù)界開始推廣和維護EDA生態(tài)閉環(huán)也有挑戰(zhàn)。最主要的是發(fā)展學(xué)術(shù)界參與開源EDA和持續(xù)維護開源項目的問題。從功利的角度看,當(dāng)高校研究人員轉(zhuǎn)移研究興趣或者課題結(jié)束時,維持開源項目的動力消失;學(xué)生花幾年的經(jīng)歷學(xué)習(xí)和掌握開源EDA工具,不如掌握商業(yè)工具對找工作更實用;高質(zhì)量的開源工作不多,學(xué)生們重新實現(xiàn)一個算法或工具有時比hack(甚至debug)一個開源項目的代碼更快。學(xué)生畢業(yè)之后,如果沒有一個很好的文檔和高質(zhì)量的代碼管理,那么后續(xù)的學(xué)術(shù)繼續(xù)迭代開發(fā)的動力也不足。
因此論壇建議適當(dāng)引導(dǎo)高校的學(xué)術(shù)評價標準,使代碼和文檔質(zhì)量高的開源項目、Github/Gitee等代碼托管協(xié)作平臺上星數(shù)多的項目,成為高校學(xué)者、學(xué)生以及企業(yè)專家的學(xué)術(shù)名片,這對于啟動和維護開源EDA項目、對于學(xué)生就業(yè)將會是極大的激勵。
開源EDA生態(tài)的建立也需要基準測試集,特別是可以完成端到端流程的工業(yè)級基準測試集;如何從學(xué)術(shù)界小規(guī)模數(shù)據(jù)集到工業(yè)級先進設(shè)計,是個需要繼續(xù)探討的話題。業(yè)界知名的芯片設(shè)計公司能否提供一些脫敏的設(shè)計,讓開源社區(qū)可以以此為參考進行學(xué)術(shù)研究、學(xué)生競賽,以此擴大開源社區(qū)的規(guī)模。尤其,在深度學(xué)習(xí)技術(shù)與EDA領(lǐng)域緊密結(jié)合的當(dāng)代,更需要一個芯片設(shè)計領(lǐng)域的“ImageNet”來促進社區(qū)繁榮。
產(chǎn)學(xué)研有機聯(lián)合,提升軟件質(zhì)量,提供開源EDA獨有價值
前面也提到的開源代碼質(zhì)量的問題,其實開源EDA工具對軟件質(zhì)量的要求遠比其他領(lǐng)域嚴苛。因為EDA軟件與芯片設(shè)計緊密結(jié)合,一旦設(shè)計出有問題的芯片,不僅要修改軟件代碼,還要重新流片,代價高昂。因此開源EDA軟件無法像互聯(lián)網(wǎng)/游戲軟件那樣,用敏捷開發(fā)模式、低成本試錯迭代模式提高軟件質(zhì)量。
學(xué)術(shù)界的開源項目要與EDA、IP等工業(yè)界有機地聯(lián)合。高校的老師和學(xué)生啟動項目并實現(xiàn)原型,企業(yè)提供工程力量和資金用于維護和推廣,業(yè)界的工程與品控能力可以保障開源軟件的質(zhì)量和持續(xù)發(fā)展。業(yè)界不僅可以吸收開源項目的精髓,提升自己的產(chǎn)品先進性,而且還做了一個極好的廣告,在人才市場中形成良好口碑。典型的案例就是美國DARPA項目的openROAD開源項目,Cadence參與度甚至遠高于學(xué)術(shù)界綜合。放眼望去,美國成功的開源項目(LLVM,TVM等)最終都得到了業(yè)界的大力支持。
為實現(xiàn)高校與企業(yè)的有機聯(lián)合,開源EDA工具必須能提供獨特的價值,例如對新的設(shè)計方法或者新的制造工藝更為敏銳,提供與商業(yè)工具互補的功能特性。維護EDA生態(tài)閉環(huán),項目的定位、以及組織者聯(lián)結(jié)需求、資源、人員的作用十分重要。
風(fēng)險與機會并存,合理區(qū)分風(fēng)險,降低整體芯片開發(fā)成本
EDA生態(tài)在技術(shù)標準、安全可信、以及流片風(fēng)險均存在風(fēng)險。IEEE標準有成熟的運作規(guī)范,相對安全。但很多事實標準其實是三大EDA公司的私有標準。即使在開源社區(qū)有可免費使用的私有標準,也存在著跟標準相關(guān)的隱藏專利風(fēng)險。需要制定國內(nèi)標準,并掌握關(guān)鍵技術(shù)來防范專利風(fēng)險。
開源EDA軟件的可信和安全則是一把雙刃劍。一方面,開源EDA工具中可能存在惡意代碼泄露用戶的核心設(shè)計數(shù)據(jù),也可能在設(shè)計里植入惡意的硬件木馬;另一方面,EDA工具代碼開源,且貢獻者基本可以溯源,相關(guān)責(zé)任也容易追查,一切都在陽光下風(fēng)險反而可控。
針對流片失敗的風(fēng)險,可能并非開源EDA工具獨有問題。要在指甲蓋大小的硅片上擺放上百億個幾納米大小的晶體管是當(dāng)今世界最具有挑戰(zhàn)的工程,流片失敗本身是不可避免。商業(yè)公司的EDA工具也不一定能保證成功,特別是支持新技術(shù)新工藝的工具。開源許可證有免責(zé)聲明,應(yīng)讓使用開源工具進行流片的使用方充分認清風(fēng)險和成本。成功流片的開源EDA工具,反而是高質(zhì)量的最佳宣傳,有機會培育出大量以設(shè)計服務(wù)為目標的公司,憑借開源工具的使用經(jīng)驗幫助用戶提高流片成功率,有望降低整體的芯片開發(fā)和設(shè)計成本。對開源EDA工具的各種風(fēng)險,需要區(qū)別對待,隨著開源EDA工具實踐經(jīng)驗增加,反復(fù)評估風(fēng)險變化。
EDA生態(tài)子系統(tǒng)協(xié)同,尋找可持續(xù)的動力,形成價值鏈閉環(huán)
開源EDA生態(tài)有學(xué)術(shù)、企業(yè)等內(nèi)部生態(tài)子系統(tǒng)。高校立足教學(xué)和科研,適合做創(chuàng)新工作,產(chǎn)生有獨特功能、技術(shù)超前的開源EDA工具,獲取學(xué)術(shù)影響力;只要這些獨特的“優(yōu)勢”可以轉(zhuǎn)化成企業(yè)明確利益需求,就會在企業(yè)轉(zhuǎn)化為一個高質(zhì)量的產(chǎn)品級項目。但這些產(chǎn)品級項目不一定會重新開源。應(yīng)該尋找一種激勵企業(yè)的模式,在其保護商業(yè)價值的同時,能持續(xù)對共性技術(shù)部分保持開放,讓學(xué)術(shù)界能在更高質(zhì)量的EDA工具平臺上繼續(xù)貢獻。為此,可以考慮GPL許可證模式,強迫新增和修改共性功能代碼開源,再通過封裝成云服務(wù)等形式來約束GPL的作用范圍,保障企業(yè)的投入和產(chǎn)出公平。
開源EDA生態(tài)應(yīng)與外部生態(tài)合作共贏。例如,與超算和云計算的生態(tài)融合,既能解決EDA軟件算法需要消耗大量算力的問題,促進超算中心的業(yè)務(wù)發(fā)展;也可以借助云服務(wù)吸引更多的工具用戶,降低使用獲取和使用門檻,同時也促進云計算廠商的用戶群。Google和微軟的EDA上云就是非常典型的案例。
寫在最后
本次論壇由CCF YOCSEF上海AC組織,執(zhí)行主席為CCF YOCSEF上海主席(2021-2022)蔣力,副主席(2020-2021)裴頌文,論壇思辨和閉門討論分別由北京大學(xué)羅國杰、浙江大學(xué)卓成共同主持。論壇吸引了50余位高校學(xué)者、企業(yè)專家與研究生參加。
后續(xù)我們還會繼續(xù)組織敏捷設(shè)計,框架與編譯器等專題論壇,與開源EDA,開源硬件開放指令集關(guān)系緊密,敬請關(guān)注。