最近,chiplet這個概念熱了起來,從美國DARPA的CHIPS項目到Intel的Foveros等,都把chiplet看成是未來芯片的重要基礎(chǔ)技術(shù)。簡單來說,chiplet技術(shù)就是像搭積木一樣,把一些預(yù)先生產(chǎn)好的能實現(xiàn)特定功能的芯片裸片(die)通過先進(jìn)的集成技術(shù)(比如3D integration等)集成封裝在一起,形成一個系統(tǒng)芯片(SoC)。而這些基本的裸片就是chiplet。從這個意義上來說,chiplet就是一個新的IP復(fù)用模式。未來,以chiplet模式集成的芯片會是一個“超級”異構(gòu)系統(tǒng),可以為AI計算帶來更多的靈活性和新的機(jī)會。
chiplet模式興起
chiplet的概念其實很簡單,就是硅片級別的”復(fù)用”。設(shè)計一個系統(tǒng)級芯片,以前的方法是從不同的IP供應(yīng)商購買一些IP,軟核(代碼)或硬核(版圖),結(jié)合自研的模塊,集成為一個SoC,然后在某個芯片工藝節(jié)點(diǎn)上完成芯片設(shè)計和生產(chǎn)的完整流程。未來,對于某些IP,你可能不需要自己做設(shè)計和生產(chǎn)了,而只需要購買別人己經(jīng)做好的硅片(管芯),然后在一個封裝里集成起來,形成一個SiP(System in Package)。所以chiplet也是一種IP,但它是以硅片的形式提供,而不是之前依軟件形式。
從這段描述來看chiplet可以說是一種新的芯片設(shè)計模式,要實現(xiàn)chiplet這種新的IP復(fù)用模式,首先要具備的技術(shù)基礎(chǔ)就是先進(jìn)的芯片集成封裝技術(shù)。SiP的概念其實很早就有,把多個芯片裝在一個封裝里也有很久的歷史了。但要實現(xiàn)chiplet這種高靈活度,高性能,低成本的芯片復(fù)用愿景,必須要具備有先進(jìn)的芯片集成技術(shù),比如Intel最近提出的EMIB,Foveros,3D集成技術(shù)等。
未來芯片設(shè)計中,產(chǎn)品的功能,成本與上市時間等是主要因素,如果你想把所有東西都集成在一個芯片上,導(dǎo)致芯片的面積會很大,需要很長的時間。如果你想使用先進(jìn)的制造工藝,它的成本會更高,越來越不切實際。更為重要的是未來的許多器件,使用的材料也并非一定是硅材料,可能是鍺,III-V族,碳化硅等,因此如果能把一個復(fù)雜的芯片分解成若干個子系統(tǒng),而其中有些子系統(tǒng)可能是標(biāo)準(zhǔn)化的產(chǎn)品,就是chiplet中的某一種,最后把它封裝在一體。它是近期半導(dǎo)體業(yè)在后摩爾定律的方向之一,通俗說就是“異質(zhì)集成”,或者叫“異構(gòu)集成”。
Chiplet典型范例
英特爾實際上有幾種不同的芯片組解決方案,它有助于揭示未來的芯片組三個發(fā)展方向,顯然臺積電等也擁有獨(dú)特的封裝技術(shù),由此拿到了蘋果的處理器芯片訂單。
英特爾的EMIB(Embedded Multi-Die Interconnect Bridge,嵌入式多核心互聯(lián)橋接)封裝技術(shù)理念與2.5D封裝類似,但技術(shù)水平更高。
EMIB在本質(zhì)上是一種非常薄的硅中介層(interposer),上面有密度非常高的互聯(lián)結(jié)構(gòu),我們把它們成為微凸塊,EMIB的密度遠(yuǎn)高于在其它標(biāo)準(zhǔn)封裝基板上發(fā)現(xiàn)的那種密度。微凸塊是一些微小的焊球,可以把一個芯片連接到另一個芯片上,后者連接到封裝內(nèi)的高密度互聯(lián)結(jié)構(gòu)上。
使用EMIB能把GPU和HBM(高帶寬內(nèi)存)集成在一起,使用了封裝內(nèi)部的HBM接口。然后我們在標(biāo)準(zhǔn)電路板級接口上使用了PCI Express,用它來承接GPU和CPU的功能。
另一個例子是Stratix 10 FPGA。它實際上是英特爾首次展示的EMIB解決方案。Stratix 10的中心是一個英特爾的FPGA,圍繞著它有六個小芯片。其中,有四個是高速收發(fā)器,兩個是高帶寬內(nèi)存,它們都裝在一個封裝之中。這個例子中集成了來自三家代工廠、使用了六種不同的代工節(jié)點(diǎn)生產(chǎn)出來的芯片組。因此,Stratix 10進(jìn)一步證明了不同代工廠生產(chǎn)的器件之間的互操作性。
此外,這顆芯片中使用了一種被稱為AIB的行業(yè)標(biāo)準(zhǔn)硅片到硅片接口,這是英特爾的高級接口總線。這是英特爾專為這種芯片設(shè)計的總線接口標(biāo)準(zhǔn),它是實現(xiàn)封裝內(nèi)部高帶寬、邏輯到邏輯器件互聯(lián)的重要支撐。可以說,HBM是用于內(nèi)存集成的第一個標(biāo)準(zhǔn),而AIB是用于邏輯器件集成的第一個標(biāo)準(zhǔn)。
第三個例子是英特爾的Foveros解決方案,這是邏輯器件上堆疊邏輯器件的芯片方案,在2017年12月份首次提到該方案,并在2018年一月份的CES展會上發(fā)布了一款產(chǎn)品-Lakefield。它是一種芯片組集成,不過它不是水平堆疊,而是垂直堆疊。
對于這種邏輯器件上堆疊邏輯器件方案,可能需要更長的時間才能把它演化成一種工業(yè)領(lǐng)域的標(biāo)準(zhǔn)。因為它這上面的芯片基本上都是共同設(shè)計的。在邏輯器件上堆疊內(nèi)存可能會是最先衍生出三維堆疊開發(fā)標(biāo)準(zhǔn)的地方。
散熱是最大的問題。其實,你也可以想象,硅片堆疊會讓任何類型的散熱問題都變得更為棘手。因此,我們確實需要繼續(xù)規(guī)劃分層,以適應(yīng)、調(diào)整各個熱點(diǎn)。此外,我們還需要考慮整個系統(tǒng)的架構(gòu)設(shè)計問題。三維堆疊不僅僅涉及到物理架構(gòu),它能一直影響到架構(gòu)決策,而且是整個CPU/GPU和系統(tǒng)的架構(gòu)。
對于芯片組還需要建立新的測試技術(shù)和標(biāo)準(zhǔn)。
圍繞測試的行業(yè)標(biāo)準(zhǔn)非常重要。通常而言,對于一個完整的封裝里的器件進(jìn)行測試。首先需要把一個一個能正常工作的芯片組放到封裝內(nèi),但是即便每個芯片組能正常工作,也很難保證集成在一起的大芯片能正常工作,然而這種測試需要設(shè)置另外的精細(xì)pad來放探針。
最后一個也很明顯,就是機(jī)械標(biāo)準(zhǔn),微凸塊的放置和它們之間的通路也需要有標(biāo)準(zhǔn)來支持互操作性。
很多chiplet模式的問題最終都需要EDA工具的改進(jìn)來給出答案,需要EDA工具從架構(gòu)探索,到芯片實現(xiàn),甚至到物理設(shè)計的全面支持。
chiplet模式的挑戰(zhàn)
首先當(dāng)然是集成技術(shù)的挑戰(zhàn)。chiplet模式的基礎(chǔ)還是先進(jìn)的封裝技術(shù),必須能夠做到低成本和高可靠性。這部分主要看foundry和封裝廠商。隨著先進(jìn)工藝部署的速度減緩,封裝技術(shù)逐漸成為大家關(guān)注的重點(diǎn)。此外,集成技術(shù)的挑戰(zhàn)還來自集成標(biāo)準(zhǔn)?;氐紺HIPS項目,可以看出,該項目的重點(diǎn)就是設(shè)計工具和集成標(biāo)準(zhǔn)。Intel的AIB(Advanced Interface Bus)就是一個硅片到硅片的互聯(lián)標(biāo)準(zhǔn),如果未來能夠成為業(yè)界的標(biāo)準(zhǔn)(類似ARM的AMBA總線標(biāo)準(zhǔn)的作用),則chiplet的模式就可能更快的普及。還有,對于這種“超級”異構(gòu)系統(tǒng),其更大的優(yōu)化空間也同時意味著架構(gòu)優(yōu)化的難度也會大大增加。
除了集成技術(shù)之外,chiplet模式能否成功的另一個大問題是質(zhì)量保障。我們在選擇IP的時候,除了PPA(power,performance and cost)之外,最重要的一個考量指標(biāo)就是IP本身的質(zhì)量問題。IP本身有沒有bug,接入系統(tǒng)會不會帶來問題,有沒有在真正的硅片上驗證過等等。在目前的IP復(fù)用方法中,對IP的測試和驗證已經(jīng)有比較成熟的方法。但是對于chiplet來說,這還是個需要探索的問題。雖然,相對傳統(tǒng)IP,chiplet是經(jīng)過硅驗證的產(chǎn)品,本身保證了物理實現(xiàn)的正確性。但它仍然有個良率的問題,而且如果SiP其中的一個硅片有問題,則整個系統(tǒng)都會受影響,代價很高。因此,集成到SiP中的chiplet必須保證100%無故障。從這個問題延伸,還有集成后的SiP如何進(jìn)行測試的問題。將多個chiplet封裝在一起后,每個chiplet能夠連接到的芯片管腳更為有限,有些chiplet可能完全無法直接從芯片外部管腳直接訪問,這也給芯片測試帶來的新的挑戰(zhàn)。
因此chiplet尚是個新生亊物,目前至少能供選擇的芯片組并不很多,另外它還面臨如下一些挑戰(zhàn):
眼下還沒有標(biāo)準(zhǔn)的方法貼裝或堆壘芯片組;
裸芯片到裸芯片的互連方案很昂貴;
設(shè)計和制造之間還有缺口,例如如何驗證和測試芯片組;
有一點(diǎn)目前還不是很清楚:一旦它們被制造出來交給集成商和封裝廠以后, 誰將來負(fù)責(zé)這些芯片組。