9月1日,Cadence一年一度的CadenceLIVE China用戶大會成功以線上的形式舉辦,此次“CadenceLIVE China 2020”的主題為“釋放想象”,由主題峰會、12場技術(shù)分論壇和線上設(shè)計(jì)者展會組成,匯聚Cadence的技術(shù)用戶、開發(fā)者與業(yè)界專家,涵蓋從IP/SoC設(shè)計(jì)、驗(yàn)證仿真、封裝和板級設(shè)計(jì)及系統(tǒng)分析全流程的技術(shù)分享。在主題峰會部分,嘉賓們從產(chǎn)業(yè)趨勢,到技術(shù)革新,發(fā)布了深度見解。
大會一開始,Cadence公司副總裁、中國及東南亞地區(qū)總經(jīng)理徐昀表示,隨著科創(chuàng)板助推產(chǎn)業(yè)發(fā)展騰飛,優(yōu)秀的半導(dǎo)體企業(yè)開始不斷走到臺前,中國一直是Cadence投資重地,本地化支撐是我們的服務(wù)宗旨,對中國半導(dǎo)體未來充滿信心。
Cadence公司副總裁、中國及東南亞地區(qū)總經(jīng)理徐昀
Cadence公司CEO陳立武(Lip-Bu Tan)帶來了主題為《推動以數(shù)據(jù)為中心的革命》的演講,他表示,目前業(yè)內(nèi)有5大技術(shù)潮流:5G、超大規(guī)模計(jì)算(Hyperscale Computing)、工業(yè)物聯(lián)網(wǎng)、自動駕駛以及AI,背后推動力則是芯片。大數(shù)據(jù)推動整個半導(dǎo)體行業(yè)的發(fā)展,包括數(shù)據(jù)收集、傳輸、存儲、處理、分析,需要各方面的創(chuàng)新,包括架構(gòu)、設(shè)計(jì)EDA、IP以及整個生態(tài)的創(chuàng)新。
Cadence公司CEO陳立武
如今我們正在步入超大規(guī)模計(jì)算時代,一方面數(shù)據(jù)指數(shù)級上升,過去兩年時間產(chǎn)生的數(shù)據(jù)達(dá)到了約90%,其中非結(jié)構(gòu)化的數(shù)據(jù)占到80%,只有低于2%的數(shù)據(jù)是被分析和處理的。另一方面,性能和延時需要滿足從端到5G固定無線接入,再到邊緣計(jì)算,以及后面的數(shù)據(jù)中心的各自需求。超大規(guī)模的資本投入也使得產(chǎn)業(yè)轉(zhuǎn)型成為可能,再加之受到從年初以來的疫情影響,人們的工作、生活、娛樂行為開始轉(zhuǎn)為線上方式,使得相關(guān)的資本支出將繼續(xù)增加。
截取自陳立武演講
陳立武表示,數(shù)據(jù)中心的革命正在推動產(chǎn)業(yè)多方面的需求以及技術(shù)創(chuàng)新,在數(shù)據(jù)處理方面,應(yīng)用開始驅(qū)動系統(tǒng)設(shè)計(jì),特定領(lǐng)域的加速變得非常重要,管理軟件堆棧也日益重要;在存儲方面,出現(xiàn)以內(nèi)存為中心的計(jì)算,對延遲、帶寬、容量和成本有了更高要求,下一代存儲技術(shù)如PCM、MRAM、QVM、3D NAND需求旺盛;在數(shù)據(jù)連接方面,需要超高帶寬,市面上已經(jīng)出現(xiàn)從12.8 Terabits到25.6 Terabits傳輸能力的方案,51.2 Terabits的方案明年也將出現(xiàn);在數(shù)據(jù)分析方面,數(shù)據(jù)訓(xùn)練需要大量的標(biāo)記數(shù)據(jù)集,也需要對數(shù)據(jù)進(jìn)行標(biāo)簽和分析的新方法,此外啟發(fā)式函數(shù)和圖分析會有很大發(fā)展。
如此的時代大背景下,AI/ML、系統(tǒng)設(shè)計(jì)以及EDA的發(fā)展正在推動產(chǎn)業(yè)從設(shè)計(jì)到系統(tǒng)再到智能化的發(fā)展,因此,Cadence也成立了Intelligent System Design策略,其中包括整合EDA、系統(tǒng)設(shè)計(jì)和AI;貫穿整個設(shè)計(jì)的智能化;以計(jì)算軟件為基礎(chǔ);系統(tǒng)、硬件、軟件的協(xié)同優(yōu)化;跨多個系統(tǒng)域。
截取自陳立武演講
摩爾定律速度的放緩,設(shè)計(jì)成本的不斷增加,行業(yè)內(nèi)開始探索新的突破口,其中異構(gòu)集成、SiP、Chiplets等都實(shí)現(xiàn)了創(chuàng)新,陳立武表示,Cadence可以在3D封裝方面提供完整的設(shè)計(jì)解決方案,尤其擅長混合融合設(shè)計(jì)。
在演講期間,陳立武透露Cadence大力投資了Green Hills公司,加強(qiáng)了在安全嵌入式方面的投入,進(jìn)一步完善Cadence智能系統(tǒng)設(shè)計(jì)的策略,幫助客戶設(shè)計(jì)更優(yōu)質(zhì)的芯片以及更快的上市時間,滿足不同需求。
在云服務(wù)方案,給客戶不同應(yīng)用方式,目前有125家大小公司在使用Cadence的方案,其中包括臺積電、三星等客戶。目前,Cadence的工具可以在云上操作。
Cadence公司總裁Anirudh Devgan博士的演講主題為《計(jì)算軟件驅(qū)動智能系統(tǒng)設(shè)計(jì)》。Anirudh Devgan表示:“未來十年,科技將驅(qū)動更多的計(jì)算軟件、更多的數(shù)據(jù)分析以及更多的數(shù)學(xué)軟件。無論是EDA還是AI系統(tǒng)方面,Cadence的軟件都處于非常有利的位置?!?/p>
Cadence公司總裁Anirudh Devgan博士
其中,驗(yàn)證芯片和系統(tǒng)是一個非常大的問題,據(jù)Anirudh Devgan介紹,Cadence的客戶運(yùn)行了非常多的驗(yàn)證和仿真加速周期,其中CPU核心是10的13次方,GPU設(shè)計(jì)是10的15次方。如果運(yùn)行10個15次方的周期,對于芯片驗(yàn)證來說是非常龐大,但永遠(yuǎn)不知道什么時候是足夠的。
截取自Anirudh Devgan演講
隨著時間推移,在軟件和硬件驗(yàn)證需求會越來越大。Anirudh Devgan稱“我們使用了多個引擎,包括仿真器,形式驗(yàn)證引擎,使得每個引擎性能達(dá)到一流?!?/p>
當(dāng)然,一流的引擎遠(yuǎn)遠(yuǎn)不夠,背后的計(jì)算運(yùn)籌也值得思考,它決定了使用更好的不同引擎的程度,以及驗(yàn)證解決方案的整體有效性。在驗(yàn)證中,計(jì)算運(yùn)籌使用數(shù)學(xué)算法來管理不同的引擎,并知道什么時候使用什么。
在回歸測試?yán)又?,過程中包含了大量的驗(yàn)證仿真,那么回歸測試的有效性決定了整體驗(yàn)證的有效性。Anirudh Devgan表示Xcelium ML使用了機(jī)器學(xué)習(xí),來提高整體回歸和驗(yàn)證的吞吐量。運(yùn)行Xcelium ML可以獲得相同的驗(yàn)證覆蓋率、相同的設(shè)計(jì)覆蓋率,但速度加快了5倍。
截取自Anirudh Devgan演講
Anirudh Devgan介紹了Cadence驗(yàn)證方案的另一亮點(diǎn)——Palladium硬件仿真加速器和Protium原型驗(yàn)證平臺的動態(tài)組合,Palladium是SoC調(diào)試中最好的引擎。而Protium在軟件調(diào)試方面堪稱一流,運(yùn)行速度比Palladium快得多,兩者結(jié)合就有兩個相同的前端,因此可以非常容易的從硬件驗(yàn)證過渡到軟件驗(yàn)證,這種組合對客戶非常有益。兩者的使用多少取決于客戶的靈活調(diào)整。
截取自Anirudh Devgan演講
在數(shù)字實(shí)現(xiàn)設(shè)計(jì)方面,Anirudh Devgan回顧了Cadence的產(chǎn)品——Innovus,Genus,Tempus,Quantus。最早的產(chǎn)品追溯到2013年,期間,Cadence的目標(biāo)是提供一個完全的整合方案。當(dāng)工藝節(jié)點(diǎn)走到16nm、7nm以下,引擎需要被完全整合,Cadence需要持續(xù)提供最好的PPA產(chǎn)品(功耗、性能和面積)。
而數(shù)字全流程的關(guān)鍵技術(shù)就是運(yùn)用ML,當(dāng)客戶設(shè)計(jì)他們的芯片時,他們并不是只運(yùn)行一次這些工具。工具一次次被運(yùn)行,使用者在運(yùn)行中獲得知識,然后將其轉(zhuǎn)換到下一次運(yùn)行中進(jìn)一步優(yōu)化,這是過去幾十年常規(guī)設(shè)計(jì)過程。只有使用機(jī)器學(xué)習(xí),它提供精確的框架,將之前的知識應(yīng)用到下一次運(yùn)行中,Anirudh Devgan稱之為非常強(qiáng)大的轉(zhuǎn)變。不僅運(yùn)行一次,而且從一次運(yùn)行到下一次運(yùn)行知道怎樣優(yōu)化。使用ML是一個強(qiáng)大的科技,來對設(shè)計(jì)規(guī)格進(jìn)行更有效的搜索,它將會在工具中找到最佳的選擇,最好的流程,供客戶使用。
截取自Anirudh Devgan演講
在3D-IC方面,“我們正在努力使Allegro與Innovus和Virtuoso結(jié)合,這就是IC設(shè)計(jì)實(shí)現(xiàn)系統(tǒng)以及封裝實(shí)現(xiàn)系統(tǒng),為客戶提供一個整合的方案?!?Anirudh Devgan表示,“Cadence處在一個特殊位置,作為僅有的能真的無縫整合先進(jìn)封裝和IC設(shè)計(jì)的公司,在這上面,我們正在加入許多分析工具。產(chǎn)業(yè)正在發(fā)生巨大的變化,Cadence正在大量投資,為客戶提供正確的方案?!?/p>
截取自Anirudh Devgan演講
Anirudh Devgan還提到一項(xiàng)收購案,即收購InspectAR,一款增強(qiáng)現(xiàn)實(shí)的平臺?!暗谝淮芜M(jìn)入增強(qiáng)現(xiàn)實(shí)領(lǐng)域,從Allegro平臺開始服務(wù)Allegro用戶,我相信增強(qiáng)現(xiàn)實(shí)能真的幫助PCB和封裝設(shè)計(jì)?!?/p>
“AR是一個特殊的價(jià)值點(diǎn),正在飛速發(fā)展,但還沒有應(yīng)用在EDA設(shè)計(jì)工具以及系統(tǒng)工具中,但我們覺得這是應(yīng)用AR到Allegro和SoC產(chǎn)品的絕好機(jī)會?!?/p>
在《大芯片量產(chǎn),硬科技落地》的主題演講中,燧原科技CEO趙立東做開場白:“2020年已過大半,充滿了機(jī)遇與不確定性,本著做大芯片,拼硬科技的初心。”
燧原科技CEO趙立東
從英偉達(dá)市值超過英特爾這一標(biāo)志性事件來看,趙立東表示:“英偉達(dá)憑借著在AI領(lǐng)域的龍頭地位和重倉押注數(shù)據(jù)中心,這也是燧原定位的市場,說明我們戰(zhàn)略方向是正確的,在互聯(lián)網(wǎng)、垂直市場和新基建三個方向積極拓展業(yè)務(wù),以技術(shù)創(chuàng)新和業(yè)務(wù)盈利雙輪驅(qū)動業(yè)務(wù)發(fā)展?!?/p>
從具體產(chǎn)品來看,據(jù)燧原科技COO張亞林介紹,燧原科技DTU云端訓(xùn)練芯片系統(tǒng)的架構(gòu)是GCA(General Compute Architecture)架構(gòu),在以往,AI的通用架構(gòu)是GPU,隨著時間發(fā)展與技術(shù)迭代,英偉達(dá)和AMD不再把GPU作為加速手段,而是把游戲加速卡與AI加速卡分開。
燧原科技COO張亞林
張亞林表示:“燧原科技一直遵循最先進(jìn)的架構(gòu)設(shè)計(jì)原則,在DTU云端訓(xùn)練芯破系統(tǒng)里,完全通用化了計(jì)算系統(tǒng),其中囊括四個模塊:通用計(jì)算引擎、通用數(shù)據(jù)引擎、通用智能互聯(lián)和通用編程模型?!?/p>
其中,通用計(jì)算引擎負(fù)載AI計(jì)算部分,可以進(jìn)行全數(shù)據(jù)精度的計(jì)算,同時內(nèi)置特定加速器對點(diǎn)/向量/矩陣運(yùn)算,還有內(nèi)置核心對超越函數(shù)加速,同時支持多線程和多核心同步。通過數(shù)據(jù)引擎對L1/L2/L3分布式存儲,且內(nèi)置計(jì)算部分,還是指令驅(qū)動的數(shù)據(jù)流,對帶寬/能耗進(jìn)行深度優(yōu)化,以及稀疏處理。在通用智能互聯(lián)部分,內(nèi)置了強(qiáng)大互聯(lián)引擎,構(gòu)建2D Mesh的拓?fù)浣Y(jié)構(gòu),也支持定制拓?fù)浣Y(jié)構(gòu),燧原分布式運(yùn)算支持多機(jī)多卡部署。在通用編程模型上,充分設(shè)計(jì)自己編程語言,對計(jì)算流和運(yùn)算核心進(jìn)行高效編程,也支持自動算子生成和融合。
具體規(guī)格來看,云燧T10支持20TFLOPS的在FP32的單卡算力,以及80TFLOPS在BF16的算力,支持PCIe 4.0互聯(lián),最大功耗225W。涵蓋了人工智能大部分場景,計(jì)算機(jī)視覺、語音、自然語言處理、推薦、強(qiáng)化學(xué)習(xí)等復(fù)雜模型訓(xùn)練。
此外,云燧T10-Matrix是一個面向數(shù)據(jù)中心的人工智能訓(xùn)練集群系統(tǒng),目前已完成大規(guī)模部署的互聯(lián)網(wǎng)數(shù)據(jù)中心的商用集群系統(tǒng)(可擴(kuò)展到千卡規(guī)模)。
“大芯片的設(shè)計(jì)難度比小芯片是指數(shù)級上升,挑戰(zhàn)主要在芯片、板卡、服務(wù)器以及軟件上。”張亞林表示大芯片的量產(chǎn)并不是觸手可得,芯片端需要保證可靠性、在性能/頻率/電壓調(diào)協(xié)下保持性能、良率、功耗/散熱;板卡端要保持可靠性、信號完整性、良率、功耗/散熱問題;服務(wù)器方面,需要進(jìn)行兼容性測試、壓力測試、質(zhì)量認(rèn)證以及系統(tǒng)工具;軟件端,需要考慮可靠性/穩(wěn)定性、靈活的編程模型和開發(fā)接口、多模型覆蓋以及完整工具鏈。
真正的大芯片量產(chǎn),硬科技落地要走過非常長的路,其中架構(gòu)完成只是完成5%,流片完成只進(jìn)行了20%,芯片點(diǎn)亮完成了30%,芯片功能測試完成只是達(dá)成了50%,此后還要從芯片、板卡、服務(wù)器、軟件等多方面保證,才能確保最終的大芯片量產(chǎn)。
最后,張亞林表示,大芯片是中國挺起科技脊梁的必要方向,我們需要實(shí)現(xiàn)真正的業(yè)務(wù)落地和算力普惠,為中國的科技界帶來更多更好的解決方案,實(shí)現(xiàn)整個人工智能規(guī)?;膽?yīng)用,這才是當(dāng)下科技時代應(yīng)該做的東西。
亞馬遜網(wǎng)絡(luò)服務(wù)副總裁、Annapurna Labs聯(lián)合創(chuàng)始人/ CTO Nafea Bshara演講主題為《云計(jì)算和工業(yè)合作如何幫助改變芯片開發(fā)的曲線》,演講一開始,Nafea Bshara從一款芯片產(chǎn)品說起。
亞馬遜網(wǎng)絡(luò)服務(wù)副總裁、Annapurna Labs聯(lián)合創(chuàng)始人/ CTO Nafea Bshara
幾個月前,亞馬遜發(fā)布了第二代自研服務(wù)器芯片Graviton2,基于ARM架構(gòu)自研的第二代服務(wù)器處理器芯片Graviton2,相比1代Graviton,Graviton2的性能提升7倍。在此前的發(fā)布會上,亞馬遜還將其與配備Intel至強(qiáng)鉑金(最高3.1GHz)的第五代實(shí)例進(jìn)行對比,單核心性能全面領(lǐng)先。
截取自Nafea Bshara演講
也因?yàn)榇?,外界對Annapurna Labs的關(guān)注度不斷提高。據(jù)Nafea Bshara介紹,Annapurna Labs成立于2011年,專注于IT基礎(chǔ)設(shè)施,起初是一個非常小的團(tuán)隊(duì),資本也不是很多。隨著市場的炒作,人們開始關(guān)注云計(jì)算的初創(chuàng)公司,但在2011年,人們對云計(jì)算的關(guān)注度還不是很高。
資料顯示,2015年時,Annapurna Labs與亞馬遜進(jìn)行了合作,亞馬遜推出了EC2 C4實(shí)例系列。除了將網(wǎng)絡(luò)虛擬化裝載到定制硬件之外,這些實(shí)例還得到了為存儲服務(wù)優(yōu)化的ASIC的支持。隨后是收購讓亞馬遜如虎添翼,不斷在服務(wù)器芯片上有自己的動作。
Nafea Bshara表示,半導(dǎo)體行業(yè)有一個獨(dú)特的產(chǎn)業(yè)鏈,囊括EDA、IP、代工廠、封裝等,而芯片設(shè)計(jì)又是一個高風(fēng)險(xiǎn)的業(yè)務(wù),依賴于全球技術(shù)和供應(yīng)商的支持。
此外,芯片的開發(fā)還遵循著開發(fā)成本、價(jià)值時間、工程人員不斷指數(shù)級增長的規(guī)律。起初亞馬遜采取與Arm等合作伙伴合作的方式,來進(jìn)入到市場,并從18個月內(nèi)完成從0到投產(chǎn)的目標(biāo)。隨后困難接踵而至,先進(jìn)工藝的追求開始影響亞馬遜的突破。Nafea Bshara表示,此時的亞馬遜開始思考如何通過強(qiáng)大的工具來制定計(jì)劃和降低成本,與此同時,亞馬遜開始與Cadence緊密的合作。
截取自Nafea Bshara演講
Nafea Bshara聲稱,利用Cadence JasperGold,通過形式驗(yàn)證是提高質(zhì)量的關(guān)鍵所在,而這也是亞馬遜提高芯片質(zhì)量和工程生產(chǎn)率的最佳工具,同時可以優(yōu)化上市時間以及降低開發(fā)成本。整體來說,在完成關(guān)鍵任務(wù)所需的時間上縮短了10倍以上。
此外,使用亞馬遜Graviton2可以處理大部分的EDA工作負(fù)載,據(jù)Nafea Bshara介紹,從2016年-2017年推出的R4到2020年的R6g實(shí)例來看,AWS最新的Graviton2在R6g上的實(shí)例,比前一代R5上英特爾的芯片提高20%運(yùn)算速度,以及20%的功耗降低。從2017年到2020年的進(jìn)化來看,整體運(yùn)算速度提高了44%,功耗優(yōu)化了89%。
從基于云的EDA開發(fā)趨勢來看,有了質(zhì)的轉(zhuǎn)變,曾經(jīng)需要考慮服務(wù)器購買、服務(wù)器更新、購買怎樣服務(wù)器的抉擇。如今基于云的EDA開發(fā),可以挑選最理想的服務(wù)器,對產(chǎn)品上市和IT成本有了很大優(yōu)化,團(tuán)隊(duì)擁有自己的預(yù)算并且開支受到監(jiān)控,更可以在預(yù)算之內(nèi)選擇更多服務(wù)器,最后還有安全監(jiān)控、管理、存儲/備份等服務(wù)。
作為集成電路產(chǎn)業(yè)上游的領(lǐng)軍企業(yè),Cadence在過去30多年見證了全球半導(dǎo)體的技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展。如今,數(shù)據(jù)的爆炸式增長正在助推數(shù)據(jù)中心的革命,而軟件工具在背后支撐起整個產(chǎn)業(yè)鏈的健康快速的發(fā)展,一場軟件創(chuàng)新時代已經(jīng)來臨。