《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 嵌入式技術(shù) > 業(yè)界動(dòng)態(tài) > 從AI Chip到AI Chiplet

從AI Chip到AI Chiplet

2019-09-27
關(guān)鍵詞: chiplet

  最近,chiplet這個(gè)概念熱了起來(lái),從DARPA的CHIPS項(xiàng)目到Intel的Foveros,都把chiplet看成是未來(lái)芯片的重要基礎(chǔ)技術(shù)。簡(jiǎn)單來(lái)說(shuō),chiplet技術(shù)就是像搭積木一樣,把一些預(yù)先生產(chǎn)好的實(shí)現(xiàn)特定功能的芯片裸片(die)通過(guò)先進(jìn)的集成技術(shù)(比如3D integration)集成封裝在一起形成一個(gè)系統(tǒng)芯片。而這些基本的裸片就是chiplet。從這個(gè)意義上來(lái)說(shuō),chiplet就是一個(gè)新的IP重用模式。未來(lái),以chiplet模式集成的芯片會(huì)是一個(gè)“超級(jí)”異構(gòu)系統(tǒng),可以為AI計(jì)算帶來(lái)更多的靈活性和新的機(jī)會(huì)。

  chiplet模式簡(jiǎn)介

  chiplet的概念其實(shí)很簡(jiǎn)單,就是硅片級(jí)別的重用。設(shè)計(jì)一個(gè)系統(tǒng)級(jí)芯片,以前的方法是從不同的IP供應(yīng)商購(gòu)買(mǎi)一些IP,軟核(代碼)或硬核(版圖),結(jié)合自研的模塊,集成為一個(gè)SoC,然后在某個(gè)芯片工藝節(jié)點(diǎn)上完成芯片設(shè)計(jì)和生產(chǎn)的完整流程。未來(lái),對(duì)于某些IP,你可能不需要自己做設(shè)計(jì)和生產(chǎn)了,而只需要買(mǎi)別人實(shí)現(xiàn)好的硅片,然后在一個(gè)封裝里集成起來(lái),形成一個(gè)SiP(System in Package)。所以chiplet也是一種IP,但它是以硅片的形式提供的。

  chiplet的概念最早來(lái)自DARPA的CHIPS(Common Heterogeneous Integration and IP Reuse Strategies)項(xiàng)目。該項(xiàng)目試圖解決的主要問(wèn)題如下“The monolithic nature of state-of-the-art SoCs is not always acceptable for DoD or other low-volume applications due to factors such as high initial prototype costs and requirements for alternative material sets. To enhance overall system flexibility and reduce design time for next-generation products, the Common Heterogeneous Integration and Intellectual Property (IP) Reuse Strategies (CHIPS) program seeks to establish a new paradigm in IP reuse.”。而它的愿景是:“The vision of CHIPS is an ecosystem of discrete modular, reusable IP blocks, which can be assembled into a system using existing and emerging integration technologies. Modularity and reusability of IP blocks will require electrical and physical interface standards to be widely adopted by the community supporting the CHIPS ecosystem. Therefore, the CHIPS program will develop the design tools and integration standards required to demonstrate modular integrated circuit (IC) designs that leverage the best of DoD and commercial designs and technologies.” 從這段描述來(lái)看chiplet可以說(shuō)是一種新的芯片設(shè)計(jì)模式,要實(shí)現(xiàn)chiplet這種新的IP重用模式,首先要具備的技術(shù)基礎(chǔ)就是先進(jìn)的芯片集成封裝技術(shù)。SiP的概念很早就有,把多個(gè)硅片封裝在一個(gè)硅片里也有很久的歷史了。但要實(shí)現(xiàn)chiplet這種高靈活度,高性能,低成本的硅片重用愿景,必須要先進(jìn)的芯片集成技術(shù),比如Intel最近提出的Foveros,3D集成技術(shù)。

1.jpg

2.jpg

  source: Intelsource: Intel

  3D集成技術(shù)使我們的芯片規(guī)??梢栽谌S空間發(fā)展,而不是傳統(tǒng)的限于二維空間。由于在二維空間里,摩爾定律已經(jīng)很難延續(xù),向三維發(fā)展也是一個(gè)自然的趨勢(shì)。此外,正如下圖所說(shuō)的,這種3D集成技術(shù)除了提供更高的計(jì)算密度之外,還可以讓我們重新考慮系統(tǒng)架構(gòu)(enabling a complete rethinking of system),這個(gè)也就是chiplet模式給我們帶來(lái)的各種新的靈活性,后面再詳細(xì)討論。

3.jpg

  source: Intel

  這里我們不詳細(xì)討論3D集成技術(shù)的細(xì)節(jié),根據(jù)目前的發(fā)展,在未來(lái)幾年,相關(guān)技術(shù)會(huì)越來(lái)越成熟,應(yīng)該能夠?yàn)閏hiplet模式的普及做好準(zhǔn)備。

  AI chiplet的優(yōu)勢(shì)

  總得來(lái)說(shuō),我個(gè)人認(rèn)為chiplet模式對(duì)于AI硬件的長(zhǎng)期發(fā)展會(huì)有非常正面的影響,主要體現(xiàn)在下面幾個(gè)方面。

  第一,工藝選擇的靈活性

  chiplet模式的最大優(yōu)勢(shì)之一就是一個(gè)系統(tǒng)里可以集成多個(gè)工藝節(jié)點(diǎn)的硅片(如下圖所示)。

4.jpg

  source: Intel

  這也是chiplet模式可能支持快速開(kāi)發(fā),降低實(shí)現(xiàn)成本的一個(gè)重要因素。大家知道,在芯片設(shè)計(jì)中,對(duì)于不同目的和類(lèi)型的電路,并不是最新的工藝就總是最合適的。在目前的單硅片系統(tǒng)里,系統(tǒng)只能在一個(gè)工藝節(jié)點(diǎn)上實(shí)現(xiàn)。而對(duì)于很多功能來(lái)說(shuō),使用成本高風(fēng)險(xiǎn)大的最新工藝即沒(méi)有必要又非常困難,比如一些專(zhuān)用加速功能和模擬設(shè)計(jì)。如果chiplet模式成立,那么大家在做系統(tǒng)設(shè)計(jì)的時(shí)候則有了更多的選擇。對(duì)于追求性能極限的模塊,比如高性能CPU,可以使用最新工藝。而特殊的功能模塊,比如存儲(chǔ)器,模擬接口和一些專(zhuān)用加速器,則可以按照需求選擇性價(jià)比最高的方案。

  這一點(diǎn)對(duì)于AI芯片的發(fā)展是相當(dāng)有利的。首先,AI加速本身就是一個(gè)DSA(專(zhuān)用領(lǐng)域架構(gòu)),其架構(gòu)本身就是專(zhuān)門(mén)為特定運(yùn)算定制的,具有很高的效率,即使選擇差一兩代的工藝,也可以滿足很多情況的要求。但目前,大多數(shù)這個(gè)領(lǐng)域的初創(chuàng)公司,都面臨工藝選擇的困境。如果選擇先進(jìn)工藝,可能一次投片就耗盡所有投資。如果不選,好像一下就輸在了起跑線。如果chiplet模式成為主流,大家的工藝選擇應(yīng)該可以更加理性,工藝雖不是最新但性價(jià)比最好的chiplet會(huì)有更多機(jī)會(huì)。第二,對(duì)于很多可能大幅提升AI運(yùn)算效率的新興技術(shù),比如存內(nèi)計(jì)算,模擬計(jì)算(包括光計(jì)算),它們使用的器件往往只在相對(duì)較低的工藝節(jié)點(diǎn)比較成熟,和系統(tǒng)的其它部分怎么集成就是個(gè)大問(wèn)題。chiplet模式也可以解決這個(gè)問(wèn)題,則這些技術(shù)的開(kāi)發(fā)商可以以chiplet IP的形式提供產(chǎn)品,和其它不同工藝的功能模塊集成在一起,而無(wú)需受限于Foundry工藝的進(jìn)展。

  第二,架構(gòu)設(shè)計(jì)的靈活性

  以chiplet構(gòu)成的系統(tǒng)可以說(shuō)是一個(gè)“超級(jí)”異構(gòu)系統(tǒng),給傳統(tǒng)的異構(gòu)SoC增加了新的維度,至少包括空間維度和工藝選擇的維度。首先,如前所述,先進(jìn)的集成技術(shù)在3D空間的擴(kuò)展可以極大提高芯片規(guī)模。這當(dāng)然對(duì)AI算力的擴(kuò)展和成本的降低有很大好處。第二,結(jié)合前述的工藝靈活性,我們可能在架構(gòu)設(shè)計(jì)中有更合理的功能/工藝的權(quán)衡,有利于AI SoC或者AIoT芯片更好的適應(yīng)應(yīng)用場(chǎng)景的需求。第三,系統(tǒng)的架構(gòu)設(shè)計(jì),特別是功能模塊間的互聯(lián),有更多優(yōu)化的空間。在目前的AI芯片架構(gòu)中,數(shù)據(jù)流動(dòng)是主要瓶頸。HBM(也可以看成是一種chiplet)可以在一定程度上解決處理器和DRAM之間的數(shù)據(jù)流動(dòng)問(wèn)題,但價(jià)格還過(guò)于昂貴。對(duì)于云端AI加速,Host CPU和AI加速芯片之間,以及多片加速芯片之間的互聯(lián),目前主要通過(guò)PCIe,NvLink,或者直接用SerDes等等。如果是chiplet方式,則是硅片的互聯(lián),帶寬,延時(shí)和功耗都會(huì)有巨大的改善。另外,目前的片上網(wǎng)絡(luò)NoC是在一個(gè)硅片(2D)上的,而未來(lái)的NoC則擴(kuò)展到硅片之間,特別是和Active Interposer結(jié)合,就可能成為一個(gè)3D網(wǎng)絡(luò),其路由,拓?fù)湟约癚oS可以有更多優(yōu)化的空間。

  第三,商業(yè)模式的靈活性

  chiplet模式在傳統(tǒng)的IP供應(yīng)商和芯片供應(yīng)商之外,提供了一個(gè)新的選擇:chiplet硅片供應(yīng)商。對(duì)于目前的AI芯片廠商來(lái)說(shuō),要么聚焦在AI加速部分,以IP形式或者外接硬件加速芯片的形式提供產(chǎn)品;要么走垂直領(lǐng)域,做集成AI加速功能的SoC。對(duì)于前者來(lái)說(shuō),chiplet可以提供一個(gè)新的產(chǎn)品形式,增加潛在的市場(chǎng),或者拉長(zhǎng)一代產(chǎn)品(工藝)的生命周期。對(duì)于一些硅實(shí)現(xiàn)能力比較強(qiáng)的廠商來(lái)說(shuō),也說(shuō)不定未來(lái)會(huì)演變成專(zhuān)門(mén)做chiplet的供應(yīng)商。對(duì)后者來(lái)說(shuō),可以直接集成合適AI chiplet而不是IP(還需要自己做芯片實(shí)現(xiàn)),大大節(jié)約項(xiàng)目開(kāi)發(fā)的時(shí)間。

  因此,可以預(yù)見(jiàn),AI chiplet會(huì)成為AI硬件重用和集成的重要模式。

  chiplet模式的挑戰(zhàn)

  首先當(dāng)然是集成技術(shù)的挑戰(zhàn)。chiplet模式的基礎(chǔ)還是先進(jìn)的封裝技術(shù),必須能夠做到低成本和高可靠性。這部分主要看foundry和封裝廠商。隨著先進(jìn)工藝部署的速度減緩,封裝技術(shù)逐漸成為大家關(guān)注的重點(diǎn)。此外,集成技術(shù)的挑戰(zhàn)還來(lái)自集成標(biāo)準(zhǔn)?;氐紺HIPS項(xiàng)目,可以看出,該項(xiàng)目的重點(diǎn)就是是設(shè)計(jì)工具和集成標(biāo)準(zhǔn)。Intel的AIB(Advanced Interface Bus)就是一個(gè)硅片到硅片的互聯(lián)標(biāo)準(zhǔn),如果未來(lái)能夠成為業(yè)界的標(biāo)準(zhǔn)(類(lèi)似ARM的AMBA總線標(biāo)準(zhǔn)的作用),則chiplet的模式就可能更快的普及。還有,對(duì)于這種“超級(jí)”異構(gòu)系統(tǒng),其更大的優(yōu)化空間也同時(shí)意味著架構(gòu)優(yōu)化的難度也會(huì)大大增加。

  除了集成技術(shù)之外,chiplet模式能否成功的另一個(gè)大問(wèn)題是質(zhì)量保障。我們?cè)谶x擇IP的時(shí)候,除了PPA之外,最重要的一個(gè)考量指標(biāo)就是IP本身的質(zhì)量問(wèn)題。IP本身有沒(méi)有bug,接入系統(tǒng)會(huì)不會(huì)帶來(lái)問(wèn)題,有沒(méi)有在真正的硅片上驗(yàn)證過(guò)等等。在目前的IP重用方法中,對(duì)IP的測(cè)試和驗(yàn)證已經(jīng)有比較成熟的方法。但對(duì)于chiplet來(lái)說(shuō),這還是個(gè)需要探索的問(wèn)題。雖然,相對(duì)傳統(tǒng)IP,chiplet是經(jīng)過(guò)硅驗(yàn)證的產(chǎn)品,本身保證了物理實(shí)現(xiàn)的正確性。但它仍然有良率的問(wèn)題,而且如果SiP中的一個(gè)硅片有問(wèn)題,則整個(gè)系統(tǒng)都受影響,代價(jià)很高。因此,集成到SiP中的chiplet必須保證100%無(wú)故障。從這個(gè)問(wèn)題延伸,還有集成后的SiP如何進(jìn)行測(cè)試的問(wèn)題。將多個(gè)chiplet封裝在一起后,每個(gè)chiplet能夠連接到的芯片管腳更為有限,有些chiplet可能完全無(wú)法直接從芯片外部管腳直接訪問(wèn),這也給芯片測(cè)試帶來(lái)的新的挑戰(zhàn)。

  最后補(bǔ)充一點(diǎn),還是那句話,有挑戰(zhàn)就有機(jī)會(huì)。個(gè)人認(rèn)為,除了前面討論的chiplet模式對(duì)普及AI硬件的推動(dòng),它還會(huì)促進(jìn)EDA工具的發(fā)展。不論是集成技術(shù),還是質(zhì)量保障,很多chiplet模式的問(wèn)題最終都需要EDA工具的改進(jìn)來(lái)給出答案,需要EDA工具從架構(gòu)探索,到芯片實(shí)現(xiàn),甚至到物理設(shè)計(jì)的全面支持。這也是CHIPS項(xiàng)目的一個(gè)重點(diǎn)是設(shè)計(jì)工具的原因。

  ?


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。