9月1日,Cadence一年一度的CadenceLIVE China用戶大會成功以線上的形式舉辦,此次“CadenceLIVE China 2020”的主題為“釋放想象”,由主題峰會、12場技術分論壇和線上設計者展會組成,匯聚Cadence的技術用戶、開發(fā)者與業(yè)界專家,涵蓋從IP/SoC設計、驗證仿真、封裝和板級設計及系統(tǒng)分析全流程的技術分享。在主題峰會部分,嘉賓們從產(chǎn)業(yè)趨勢,到技術革新,發(fā)布了深度見解。
大會一開始,Cadence公司副總裁、中國及東南亞地區(qū)總經(jīng)理徐昀表示,隨著科創(chuàng)板助推產(chǎn)業(yè)發(fā)展騰飛,優(yōu)秀的半導體企業(yè)開始不斷走到臺前,中國一直是Cadence投資重地,本地化支撐是我們的服務宗旨,對中國半導體未來充滿信心。
Cadence公司副總裁、中國及東南亞地區(qū)總經(jīng)理徐昀
Cadence公司CEO陳立武(Lip-Bu Tan)帶來了主題為《推動以數(shù)據(jù)為中心的革命》的演講,他表示,目前業(yè)內(nèi)有5大技術潮流:5G、超大規(guī)模計算(Hyperscale Computing)、工業(yè)物聯(lián)網(wǎng)、自動駕駛以及AI,背后推動力則是芯片。大數(shù)據(jù)推動整個半導體行業(yè)的發(fā)展,包括數(shù)據(jù)收集、傳輸、存儲、處理、分析,需要各方面的創(chuàng)新,包括架構、設計EDA、IP以及整個生態(tài)的創(chuàng)新。
Cadence公司CEO陳立武
如今我們正在步入超大規(guī)模計算時代,一方面數(shù)據(jù)指數(shù)級上升,過去兩年時間產(chǎn)生的數(shù)據(jù)達到了約90%,其中非結(jié)構化的數(shù)據(jù)占到80%,只有低于2%的數(shù)據(jù)是被分析和處理的。另一方面,性能和延時需要滿足從端到5G固定無線接入,再到邊緣計算,以及后面的數(shù)據(jù)中心的各自需求。超大規(guī)模的資本投入也使得產(chǎn)業(yè)轉(zhuǎn)型成為可能,再加之受到從年初以來的疫情影響,人們的工作、生活、娛樂行為開始轉(zhuǎn)為線上方式,使得相關的資本支出將繼續(xù)增加。
截取自陳立武演講
陳立武表示,數(shù)據(jù)中心的革命正在推動產(chǎn)業(yè)多方面的需求以及技術創(chuàng)新,在數(shù)據(jù)處理方面,應用開始驅(qū)動系統(tǒng)設計,特定領域的加速變得非常重要,管理軟件堆棧也日益重要;在存儲方面,出現(xiàn)以內(nèi)存為中心的計算,對延遲、帶寬、容量和成本有了更高要求,下一代存儲技術如PCM、MRAM、QVM、3D NAND需求旺盛;在數(shù)據(jù)連接方面,需要超高帶寬,市面上已經(jīng)出現(xiàn)從12.8 Terabits到25.6 Terabits傳輸能力的方案,51.2 Terabits的方案明年也將出現(xiàn);在數(shù)據(jù)分析方面,數(shù)據(jù)訓練需要大量的標記數(shù)據(jù)集,也需要對數(shù)據(jù)進行標簽和分析的新方法,此外啟發(fā)式函數(shù)和圖分析會有很大發(fā)展。
如此的時代大背景下,AI/ML、系統(tǒng)設計以及EDA的發(fā)展正在推動產(chǎn)業(yè)從設計到系統(tǒng)再到智能化的發(fā)展,因此,Cadence也成立了Intelligent System Design策略,其中包括整合EDA、系統(tǒng)設計和AI;貫穿整個設計的智能化;以計算軟件為基礎;系統(tǒng)、硬件、軟件的協(xié)同優(yōu)化;跨多個系統(tǒng)域。
截取自陳立武演講
摩爾定律速度的放緩,設計成本的不斷增加,行業(yè)內(nèi)開始探索新的突破口,其中異構集成、SiP、Chiplets等都實現(xiàn)了創(chuàng)新,陳立武表示,Cadence可以在3D封裝方面提供完整的設計解決方案,尤其擅長混合融合設計。
在演講期間,陳立武透露Cadence大力投資了Green Hills公司,加強了在安全嵌入式方面的投入,進一步完善Cadence智能系統(tǒng)設計的策略,幫助客戶設計更優(yōu)質(zhì)的芯片以及更快的上市時間,滿足不同需求。
在云服務方案,給客戶不同應用方式,目前有125家大小公司在使用Cadence的方案,其中包括臺積電、三星等客戶。目前,Cadence的工具可以在云上操作。
Cadence公司總裁Anirudh Devgan博士的演講主題為《計算軟件驅(qū)動智能系統(tǒng)設計》。Anirudh Devgan表示:“未來十年,科技將驅(qū)動更多的計算軟件、更多的數(shù)據(jù)分析以及更多的數(shù)學軟件。無論是EDA還是AI系統(tǒng)方面,Cadence的軟件都處于非常有利的位置?!?/p>
Cadence公司總裁Anirudh Devgan博士
其中,驗證芯片和系統(tǒng)是一個非常大的問題,據(jù)Anirudh Devgan介紹,Cadence的客戶運行了非常多的驗證和仿真加速周期,其中CPU核心是10的13次方,GPU設計是10的15次方。如果運行10個15次方的周期,對于芯片驗證來說是非常龐大,但永遠不知道什么時候是足夠的。
截取自Anirudh Devgan演講
隨著時間推移,在軟件和硬件驗證需求會越來越大。Anirudh Devgan稱“我們使用了多個引擎,包括仿真器,形式驗證引擎,使得每個引擎性能達到一流?!?/p>
當然,一流的引擎遠遠不夠,背后的計算運籌也值得思考,它決定了使用更好的不同引擎的程度,以及驗證解決方案的整體有效性。在驗證中,計算運籌使用數(shù)學算法來管理不同的引擎,并知道什么時候使用什么。
在回歸測試例子中,過程中包含了大量的驗證仿真,那么回歸測試的有效性決定了整體驗證的有效性。Anirudh Devgan表示Xcelium ML使用了機器學習,來提高整體回歸和驗證的吞吐量。運行Xcelium ML可以獲得相同的驗證覆蓋率、相同的設計覆蓋率,但速度加快了5倍。
截取自Anirudh Devgan演講
Anirudh Devgan介紹了Cadence驗證方案的另一亮點——Palladium硬件仿真加速器和Protium原型驗證平臺的動態(tài)組合,Palladium是SoC調(diào)試中最好的引擎。而Protium在軟件調(diào)試方面堪稱一流,運行速度比Palladium快得多,兩者結(jié)合就有兩個相同的前端,因此可以非常容易的從硬件驗證過渡到軟件驗證,這種組合對客戶非常有益。兩者的使用多少取決于客戶的靈活調(diào)整。
截取自Anirudh Devgan演講
在數(shù)字實現(xiàn)設計方面,Anirudh Devgan回顧了Cadence的產(chǎn)品——Innovus,Genus,Tempus,Quantus。最早的產(chǎn)品追溯到2013年,期間,Cadence的目標是提供一個完全的整合方案。當工藝節(jié)點走到16nm、7nm以下,引擎需要被完全整合,Cadence需要持續(xù)提供最好的PPA產(chǎn)品(功耗、性能和面積)。
而數(shù)字全流程的關鍵技術就是運用ML,當客戶設計他們的芯片時,他們并不是只運行一次這些工具。工具一次次被運行,使用者在運行中獲得知識,然后將其轉(zhuǎn)換到下一次運行中進一步優(yōu)化,這是過去幾十年常規(guī)設計過程。只有使用機器學習,它提供精確的框架,將之前的知識應用到下一次運行中,Anirudh Devgan稱之為非常強大的轉(zhuǎn)變。不僅運行一次,而且從一次運行到下一次運行知道怎樣優(yōu)化。使用ML是一個強大的科技,來對設計規(guī)格進行更有效的搜索,它將會在工具中找到最佳的選擇,最好的流程,供客戶使用。
截取自Anirudh Devgan演講
在3D-IC方面,“我們正在努力使Allegro與Innovus和Virtuoso結(jié)合,這就是IC設計實現(xiàn)系統(tǒng)以及封裝實現(xiàn)系統(tǒng),為客戶提供一個整合的方案?!?Anirudh Devgan表示,“Cadence處在一個特殊位置,作為僅有的能真的無縫整合先進封裝和IC設計的公司,在這上面,我們正在加入許多分析工具。產(chǎn)業(yè)正在發(fā)生巨大的變化,Cadence正在大量投資,為客戶提供正確的方案?!?/p>
截取自Anirudh Devgan演講
Anirudh Devgan還提到一項收購案,即收購InspectAR,一款增強現(xiàn)實的平臺?!暗谝淮芜M入增強現(xiàn)實領域,從Allegro平臺開始服務Allegro用戶,我相信增強現(xiàn)實能真的幫助PCB和封裝設計。”
“AR是一個特殊的價值點,正在飛速發(fā)展,但還沒有應用在EDA設計工具以及系統(tǒng)工具中,但我們覺得這是應用AR到Allegro和SoC產(chǎn)品的絕好機會?!?/p>
在《大芯片量產(chǎn),硬科技落地》的主題演講中,燧原科技CEO趙立東做開場白:“2020年已過大半,充滿了機遇與不確定性,本著做大芯片,拼硬科技的初心?!?/p>
燧原科技CEO趙立東
從英偉達市值超過英特爾這一標志性事件來看,趙立東表示:“英偉達憑借著在AI領域的龍頭地位和重倉押注數(shù)據(jù)中心,這也是燧原定位的市場,說明我們戰(zhàn)略方向是正確的,在互聯(lián)網(wǎng)、垂直市場和新基建三個方向積極拓展業(yè)務,以技術創(chuàng)新和業(yè)務盈利雙輪驅(qū)動業(yè)務發(fā)展?!?/p>
從具體產(chǎn)品來看,據(jù)燧原科技COO張亞林介紹,燧原科技DTU云端訓練芯片系統(tǒng)的架構是GCA(General Compute Architecture)架構,在以往,AI的通用架構是GPU,隨著時間發(fā)展與技術迭代,英偉達和AMD不再把GPU作為加速手段,而是把游戲加速卡與AI加速卡分開。
燧原科技COO張亞林
張亞林表示:“燧原科技一直遵循最先進的架構設計原則,在DTU云端訓練芯破系統(tǒng)里,完全通用化了計算系統(tǒng),其中囊括四個模塊:通用計算引擎、通用數(shù)據(jù)引擎、通用智能互聯(lián)和通用編程模型?!?/p>
其中,通用計算引擎負載AI計算部分,可以進行全數(shù)據(jù)精度的計算,同時內(nèi)置特定加速器對點/向量/矩陣運算,還有內(nèi)置核心對超越函數(shù)加速,同時支持多線程和多核心同步。通過數(shù)據(jù)引擎對L1/L2/L3分布式存儲,且內(nèi)置計算部分,還是指令驅(qū)動的數(shù)據(jù)流,對帶寬/能耗進行深度優(yōu)化,以及稀疏處理。在通用智能互聯(lián)部分,內(nèi)置了強大互聯(lián)引擎,構建2D Mesh的拓撲結(jié)構,也支持定制拓撲結(jié)構,燧原分布式運算支持多機多卡部署。在通用編程模型上,充分設計自己編程語言,對計算流和運算核心進行高效編程,也支持自動算子生成和融合。
具體規(guī)格來看,云燧T10支持20TFLOPS的在FP32的單卡算力,以及80TFLOPS在BF16的算力,支持PCIe 4.0互聯(lián),最大功耗225W。涵蓋了人工智能大部分場景,計算機視覺、語音、自然語言處理、推薦、強化學習等復雜模型訓練。
此外,云燧T10-Matrix是一個面向數(shù)據(jù)中心的人工智能訓練集群系統(tǒng),目前已完成大規(guī)模部署的互聯(lián)網(wǎng)數(shù)據(jù)中心的商用集群系統(tǒng)(可擴展到千卡規(guī)模)。
“大芯片的設計難度比小芯片是指數(shù)級上升,挑戰(zhàn)主要在芯片、板卡、服務器以及軟件上。”張亞林表示大芯片的量產(chǎn)并不是觸手可得,芯片端需要保證可靠性、在性能/頻率/電壓調(diào)協(xié)下保持性能、良率、功耗/散熱;板卡端要保持可靠性、信號完整性、良率、功耗/散熱問題;服務器方面,需要進行兼容性測試、壓力測試、質(zhì)量認證以及系統(tǒng)工具;軟件端,需要考慮可靠性/穩(wěn)定性、靈活的編程模型和開發(fā)接口、多模型覆蓋以及完整工具鏈。
真正的大芯片量產(chǎn),硬科技落地要走過非常長的路,其中架構完成只是完成5%,流片完成只進行了20%,芯片點亮完成了30%,芯片功能測試完成只是達成了50%,此后還要從芯片、板卡、服務器、軟件等多方面保證,才能確保最終的大芯片量產(chǎn)。
最后,張亞林表示,大芯片是中國挺起科技脊梁的必要方向,我們需要實現(xiàn)真正的業(yè)務落地和算力普惠,為中國的科技界帶來更多更好的解決方案,實現(xiàn)整個人工智能規(guī)?;膽茫@才是當下科技時代應該做的東西。
亞馬遜網(wǎng)絡服務副總裁、Annapurna Labs聯(lián)合創(chuàng)始人/ CTO Nafea Bshara演講主題為《云計算和工業(yè)合作如何幫助改變芯片開發(fā)的曲線》,演講一開始,Nafea Bshara從一款芯片產(chǎn)品說起。
亞馬遜網(wǎng)絡服務副總裁、Annapurna Labs聯(lián)合創(chuàng)始人/ CTO Nafea Bshara
幾個月前,亞馬遜發(fā)布了第二代自研服務器芯片Graviton2,基于ARM架構自研的第二代服務器處理器芯片Graviton2,相比1代Graviton,Graviton2的性能提升7倍。在此前的發(fā)布會上,亞馬遜還將其與配備Intel至強鉑金(最高3.1GHz)的第五代實例進行對比,單核心性能全面領先。
截取自Nafea Bshara演講
也因為此,外界對Annapurna Labs的關注度不斷提高。據(jù)Nafea Bshara介紹,Annapurna Labs成立于2011年,專注于IT基礎設施,起初是一個非常小的團隊,資本也不是很多。隨著市場的炒作,人們開始關注云計算的初創(chuàng)公司,但在2011年,人們對云計算的關注度還不是很高。
資料顯示,2015年時,Annapurna Labs與亞馬遜進行了合作,亞馬遜推出了EC2 C4實例系列。除了將網(wǎng)絡虛擬化裝載到定制硬件之外,這些實例還得到了為存儲服務優(yōu)化的ASIC的支持。隨后是收購讓亞馬遜如虎添翼,不斷在服務器芯片上有自己的動作。
Nafea Bshara表示,半導體行業(yè)有一個獨特的產(chǎn)業(yè)鏈,囊括EDA、IP、代工廠、封裝等,而芯片設計又是一個高風險的業(yè)務,依賴于全球技術和供應商的支持。
此外,芯片的開發(fā)還遵循著開發(fā)成本、價值時間、工程人員不斷指數(shù)級增長的規(guī)律。起初亞馬遜采取與Arm等合作伙伴合作的方式,來進入到市場,并從18個月內(nèi)完成從0到投產(chǎn)的目標。隨后困難接踵而至,先進工藝的追求開始影響亞馬遜的突破。Nafea Bshara表示,此時的亞馬遜開始思考如何通過強大的工具來制定計劃和降低成本,與此同時,亞馬遜開始與Cadence緊密的合作。
截取自Nafea Bshara演講
Nafea Bshara聲稱,利用Cadence JasperGold,通過形式驗證是提高質(zhì)量的關鍵所在,而這也是亞馬遜提高芯片質(zhì)量和工程生產(chǎn)率的最佳工具,同時可以優(yōu)化上市時間以及降低開發(fā)成本。整體來說,在完成關鍵任務所需的時間上縮短了10倍以上。
此外,使用亞馬遜Graviton2可以處理大部分的EDA工作負載,據(jù)Nafea Bshara介紹,從2016年-2017年推出的R4到2020年的R6g實例來看,AWS最新的Graviton2在R6g上的實例,比前一代R5上英特爾的芯片提高20%運算速度,以及20%的功耗降低。從2017年到2020年的進化來看,整體運算速度提高了44%,功耗優(yōu)化了89%。
從基于云的EDA開發(fā)趨勢來看,有了質(zhì)的轉(zhuǎn)變,曾經(jīng)需要考慮服務器購買、服務器更新、購買怎樣服務器的抉擇。如今基于云的EDA開發(fā),可以挑選最理想的服務器,對產(chǎn)品上市和IT成本有了很大優(yōu)化,團隊擁有自己的預算并且開支受到監(jiān)控,更可以在預算之內(nèi)選擇更多服務器,最后還有安全監(jiān)控、管理、存儲/備份等服務。
作為集成電路產(chǎn)業(yè)上游的領軍企業(yè),Cadence在過去30多年見證了全球半導體的技術創(chuàng)新和產(chǎn)業(yè)發(fā)展。如今,數(shù)據(jù)的爆炸式增長正在助推數(shù)據(jù)中心的革命,而軟件工具在背后支撐起整個產(chǎn)業(yè)鏈的健康快速的發(fā)展,一場軟件創(chuàng)新時代已經(jīng)來臨。