Ramune Nagisetty正著手幫助英特爾在以芯片為中心的新興行業(yè)生態(tài)系統(tǒng)當中開拓自己的席位。
所謂“小芯片(chiplets)”,是指一種系統(tǒng)制造方法,其在整體功能性方面與整體大型芯片并無區(qū)別,但實際上卻是由多個較小的芯片共同組成。盡管傳統(tǒng)的摩爾定律提升空間已經(jīng)基本耗盡,但憑借著小芯片這一天才般的創(chuàng)意,計算行業(yè)目前仍然能夠在一定程度上維持系統(tǒng)的性能改進能力。
支持者們表示,小芯片的普及代表著系統(tǒng)的專用化門檻將有所降低,而產(chǎn)品產(chǎn)量也能夠隨之提高。而更重要的是,小芯片亦有可能給無代工半導體行業(yè)帶來重大轉變,其最終目標產(chǎn)品可能體現(xiàn)為一種小型專用芯片,負責將通用型處理器與其它眾多專用芯片組合在一起。Ramune Nagisetty是英特爾公司俄勒岡州技術開發(fā)部門的首席工程師兼流程與產(chǎn)品集成總監(jiān),她一直致力于建立一個范圍可達完整行業(yè)級別的芯片生態(tài)系統(tǒng)。在2019年3月21日接受IEEE Spectrum采訪時,她與我們共同就這一愿景以及英特爾公司的技術狀況進行了探討。
Ramune Nagisetty在此次采訪中談到:
小芯片是什么
英特爾的EMIB解決方案
集成工程難題
新的測試技術與標準需求
小芯片領域的無代工初創(chuàng)企業(yè)
IEEE Spectrum(以下簡稱記者):您能否對小芯片做出定義,并聊聊小芯片為什么如此重要?
Ramune Nagisetty:小芯片屬于一塊物理硅片。其中封裝有一套IP(知識產(chǎn)權)子系統(tǒng)。它的設計目標,在于通過封裝級集成方式與其它小芯片相結合,而且一般通過高級封裝集成與標準化接口供用戶實際使用。
小芯片為什么變得越來越重要?這是因為時至今日,已經(jīng)不存在那種百試百靈的通用型解決方案。我們在不同類型的計算與工作負載層面實現(xiàn)了爆炸式的增長,因此出現(xiàn)了眾多不同的架構以支持這些不同類型的計算模型。從本質上講,一流技術的異構集成正是摩爾定律未來的全新起效形式。
記者: 說起異構技術,您所指的是是否還包括除硅材料之外的其它半導體材料?
Nagisetty:我想說的是,未來的半導體材料不一定只有硅,也應該包含其它類型的半導體制造技術。例如,大家可以使用鍺技術,簡稱III-V。在未來,我們將擁有更多半導體技術類型可供選擇。但著眼于當下,半導體材料主要指的仍然是硅。
更重要的是,即使只著眼于硅基芯片,這些芯片也肯定會發(fā)展出不同的技術節(jié)點。它們通常會針對不同領域進行性能調(diào)整——具體包括數(shù)字、模擬、RF以及內(nèi)存技術等等。
其中一大核心驅動力,當然是內(nèi)存的整合。高帶寬存儲器(簡稱HBM)在本質上正是異構芯片封裝內(nèi)集成方法的重要、亦是首批證明案例之一。內(nèi)存在本質上就屬于一種異構集成,其憑借著先進的封裝機制為我們帶來出色的使用體驗。
記者:英特爾連接芯片組的方法被命名為嵌入式多芯片互連橋。您能否向我們解釋一下,這個概念的定義是什么,又是如何起效的?
Nagisetty:大家可以將其視為一個用于將兩塊小芯片連接在一起的高密度橋接器,這實際上也是我能想到的最準確的描述方式。我想,很多朋友應該都熟悉利用硅中介層作為先進封裝基板的作法。(注:硅中介層是一種硅襯底,其擁有密集的互連與內(nèi)置硅通孔,用于實現(xiàn)不同芯片之間的高帶寬連接。)
圖片:IntelAn EMIB上的芯片(電路)連接以高密度互連方式進行整體封裝。將芯片連接至EMIB的連接凸塊要比圖左下方的普通凸塊擁有更小的彼此間隙。
在本質上講,EMIB實際上就是一個體積極小的硅中介層,其中包含密度極高的互連體系,我們將其稱之微凸塊,且密度遠高于標準封裝基板的密度。(微凸塊是一種微小的焊球,是能夠將芯片接入另一塊芯片或者封裝的高密度互連機制。)
EMIB或者橋接,一般會被嵌入至標準封裝基板當中。利用EMIB,大家即可在必要的位置輕松獲得最高的互連密度,并在其余位置利用標準封裝基板滿足其它普通互連需求。
這種作法能夠帶來諸多優(yōu)勢。其中最顯著的一點自然是成本,因為硅中介層的成本與該中介層的面積成正比。因此在使用EMIB的情況下,我們只需要在需要高密度互連的位置添加橋接即可滿足需求,而不存在額外浪費。此外,這種作法也能夠降低由材料自身特征所帶來的信號衰減——標準封裝基板能夠更好地傳遞信號,硅中介層則會嚴重影響信號傳輸。
記者: 目前英特爾公司使用的EMIB是如何實現(xiàn)的?
Nagisetty:英特爾公司實際上掌握著數(shù)種演示性芯片解決方案,這里正好借機會對其一一加以說明,我想這也有助于我們接下來進一步探討未來芯片所要遵循的三條不同發(fā)展路線。
英特爾公司目前擁有兩套基于EMIB的解決方案,而且二者之間存在著相當顯著的差別。首先是Kaby Lake-G,我們基本上將AMD Radeon GPU與高帶寬內(nèi)存(HBM)與我們的CPU芯片集成在一起。我們利用EMIB實現(xiàn)GPU與HBM的橋接,并在封裝內(nèi)提供HBM接口。在此之后,我們利用封裝內(nèi)部的PCI Express——這是一種標準的電路板級接口,專門用于集成GPU與CPU。
該解決方案的真正有趣之處,在于我們正在嘗試利用來自多家代工廠的外部開發(fā)芯片。我們希望使用HBM與PCI Express這些通用性質的行業(yè)標準接口打造一流產(chǎn)品。在這種情況下,我們采用一個能夠獨立在電路板上運行的組件(帶有HBM的GPU),并將其集成在統(tǒng)一的封裝之內(nèi)。其中PCI Express負責發(fā)送長距離信號,也就是處理典型的電路板運行需求。雖然立足封裝內(nèi)部來考慮,PCI Express并不一定是最佳解決方案,但卻是一種快速便捷的解決方案,因為我們能夠借此利用業(yè)已在行業(yè)中廣泛存在的接口。
記者: 這種集成方法能夠為英特爾的芯片產(chǎn)品帶來哪些助益?
Nagisetty:在這種情況下,我們得以實現(xiàn)外形尺寸方面的巨大改進。在移動使用場景下,外形尺寸對于筆記本電腦的設計至關重要。從本質講,設計師必須得在外形、功耗與性能這幾項指標之間做出取舍。因此,只要我們能夠盡可能縮小外形尺寸,就可以實現(xiàn)真正的優(yōu)化,即以盡可能小的尺寸提供同類最佳的解決方案。
記者: 那么,關于另一種小芯片設計方案,您又做何評價呢?
Nagisetty:接下來我要談的是Stratix 10 FPGA,這實際上也是英特爾公司首款正式展示的EMIB解決方案。Stratix 10的核心是英特爾FPGA,其中在FPGA周邊部署有六個小芯片。其中四個為高速收發(fā)器小芯片,另外兩個則是高帶寬內(nèi)存小芯片,它們?nèi)坎渴鹪谕环庋b之內(nèi)。此示例集成有來自三家不同代工廠的六種不同技術節(jié)點;也正因為如此,它才進一步證明了不同代工廠的產(chǎn)品之間完全能夠實現(xiàn)互操作性。
英特爾Stratix 10是芯片巨頭利用EMIB連接封裝內(nèi)各小芯片的主要示例方案。
另外值得一提的是,它采用了一種被稱為AIB的行業(yè)標準型晶片到晶片接口,全稱則為英特爾高級接口總線(Intel's Advanced Interface Bus)。這種接口專門為Stratix 10產(chǎn)品而打造,實際上代表著我們?yōu)榉庋b內(nèi)高帶寬、邏輯到邏輯互連方案制定的行業(yè)標準雛形。因此,HBM可以說是內(nèi)存集成領域的首個標準,而AIB則是邏輯集成層面的首個標準。
AIB這種接口能夠配合英特爾EMIB解決方案與硅插入器等其它競爭性解決方案共同使用。需要強調(diào)的是,該接口的核心優(yōu)勢在于其生態(tài)系統(tǒng)內(nèi)以FPGA為中心進行混合搭配的實現(xiàn)方法。目前,眾多不同的企業(yè)與高校正在DARPA CHIPS(全稱為通用型異構整合與IP復用策略)計劃的贊助下努力利用AIB創(chuàng)建更多小芯片設計方案。
記者: 第三個案例又是什么?
Nagisetty:我要談的第三個案例是英特爾的Foveros解決方案,也就是我們的logic-on-logic晶片堆棧。我們在去年12月首次談到這一解決方案,隨后又以Lakefield的名稱在今年1月的CES大會上公布實際產(chǎn)品。這套小芯片集成方案的差異,在于其采用的并非水平堆疊,而是垂直堆疊方法。
這種集成方式,允許用戶在兩個小芯片之間獲得極高的傳輸帶寬。然而,其基于內(nèi)部專有接口,兩個芯片也基本上需要共同設計——因為二者必須統(tǒng)一進行基板規(guī)劃,以便管理供電及散熱等具體運行問題。
對于logic-on-logic晶片堆棧而言,由于這些芯片在本質上是共同設計完成的,因此相關行業(yè)標準的出臺可能需要更長的時間。邏輯之上的存儲器堆棧有望成為3D堆疊行業(yè)標準的重要誕生點。
記者: 在設計這類堆疊型芯片時,您主要需要關注哪些具體事項?
Nagisetty:發(fā)熱問題是其中最為關鍵的挑戰(zhàn)??梢韵胂?,堆疊設計會大大加劇任何原有散熱問題的嚴重程度。因此,我們需要認真規(guī)劃基板以適應新方案的發(fā)熱點位置。此外,我們還需要考量整體系統(tǒng)架構。這意味著3D堆疊這一概念不僅存在于物理架構當中,而是涵蓋整個CPU或GPU與系統(tǒng)架構,且始終作為架構決策的核心驅動因素。此外,如果我們希望實現(xiàn)兼容任意類型的互操作性,那么我們自然也需要構建起具有互操作性的材料系統(tǒng)。為了支持這種互操作性,我們需要解決一系列具體難題,但我認為散熱是其中最核心的挑戰(zhàn);當然,電力供應與電源管理的難度同樣不容小覷。
記者: 要推進小芯片設計方案的發(fā)展,還需要哪些其它標準?
Nagisetty:與測試相關的行業(yè)標準當然非常重要。一般來講,我們會使用全封裝部件進行測試。我們需要能夠將“已知運行良好的芯片”(也就是我們能夠確保正常運行的芯片)添加至封裝之內(nèi),這樣我們就不致因為單一芯片的損壞而浪費掉其它工藝良好的小芯片,進而承擔產(chǎn)量下降的問題。換言之,我們需要建立一套以已知良好為基礎的模具策略,并建立起與之匹配的測試流程。
除此之外,我們還需要確保多供應商產(chǎn)品之間的電源與發(fā)熱管理支持體系。這意味著各供應商都能夠接入全部集成小芯片,以便實現(xiàn)電源與散熱問題的各自管理。
再有就是電氣操作性,作為我們在去年7月首次發(fā)布的接口,AIB實際上還只達到了我們所謂的PHY級別,即電氣與物理接口級別。很明顯,我們還需要進一步通過上層協(xié)議提供實施標準。
而最后一點,相信很多朋友也能猜到,就是機械層面的標準——具體來講,就是確保各微凸塊的放置與不同微凸塊間路由實現(xiàn)互操作性的支持標準。
Intel公司Ramune Nagisetty
記者: 您能否給我們講講“已知良好晶片”的問題,它的測試與小芯片的測試有什么不同之處嗎?
Nagisetty:這個嘛,二者其實真的不太一樣,因為對“已知良好晶片”的保障主要集中在對于封裝部件的熱測試。而在小芯片方面,則要求我們在封裝之前對裸晶片進行基礎測試——即確保各小芯片都擁有相同的功能水平。更具體地講,封裝部件的測試更容易,供電傳輸機制的設計難度也更低。而當我們面對的是裸晶片(也就是尚未進行封裝的芯片),測試人員往往很難達到同樣的探測級別。換言之,我們需要設置額外的精細沖擊墊才能設置檢測探針。
還有一點需要強調(diào),即對獨立芯片進行測試所需要的一切——包括時鐘以及能夠對每一塊小芯片進行完整測試的全部因素——都必須被設計到芯片之內(nèi)。小芯片的自身測試不可依賴于其它小芯片,它們必須在封裝之前各自經(jīng)歷完全獨立的測試。
我們正在努力進行這方面的探索,其重要意義我相信也無需多言。大家可以想象,當面對一個包含多個小芯片的封裝部件時,該部件中統(tǒng)一包含有多種價值。而一旦這些小芯片中的任意一個發(fā)生損壞且處于非冗余或不可修復狀態(tài),那么就相當于我們必須得因此放棄掉其它仍然能夠正常運作的小芯片——或者說它們所代表的價值。記者: 小芯片的優(yōu)勢當中,包不包括帶來更好的產(chǎn)能表現(xiàn)?畢竟它們物理體積更小,所以出錯幾率也更低,是這樣嗎?
Nagisetty:小芯片確實能夠實現(xiàn)可觀的產(chǎn)量提升,這是英特爾公司選擇這一發(fā)展方向的原因之一,但絕非唯一的原因。目前。產(chǎn)量能否真正提高,主要取決于我們能夠在實施封裝之前對這些晶片進行測試。
記者: 那么,小芯片會給處理器的設計方式帶來怎樣的改變?
Nagisetty:高帶寬內(nèi)存集成無疑是最重要的證據(jù)之一,其已經(jīng)被廣泛應用于GPU以及高性能系統(tǒng)中的AI處理器。在這種情況下,芯片與存儲器的封裝集成已經(jīng)開始給芯片的設計與集成方法帶來改變。
小芯片的協(xié)同設計必然會成為一個重要的發(fā)展領域?,F(xiàn)在我真正關注的是,未來將有多家供應商負責為英特爾提供芯片。那么,其中的結構性邊界在哪里?我們?nèi)绾胃鶕?jù)我們所能掌握的有限構建單元打造出行業(yè)領先的產(chǎn)品?我認為,我們目前尚處在這場革命的起步階段,而未來將有一個嶄新的行業(yè)生態(tài)系統(tǒng)以此為基礎蓬勃發(fā)展。
理解不同小芯片供應商的實際需求,并以此為基礎實現(xiàn)跨邊界通信將變得非常重要。另外,仿真工具與方法也將成為我們突破傳統(tǒng)邊界的重要助力。因此,是的,它將改變我們對芯片或者封裝部件的設計方式,也必然會隨著時間的推移改變整個半導體生態(tài)系統(tǒng)的發(fā)展態(tài)勢。
記者: 您能不能詳細講講這一新興生態(tài)系統(tǒng)呢?如果您在接下來的十年之內(nèi)領導一家無代工初創(chuàng)企業(yè),那么您的業(yè)務將呈現(xiàn)出怎樣的面貌?小芯片革命會對這些企業(yè)的運營方式帶來怎樣的改變?
Nagisetty:在我看來,這一切對于無代工初創(chuàng)企業(yè)而言絕對是個激動人心的時刻,因為我們將有可能創(chuàng)建一個更小的IP子系統(tǒng),并通過小芯片集成方法帶來巨大的實際價值。
DARPA CHIPS計劃的核心目標之一,就是從根本層面支持IP(知識產(chǎn)權)復用,并降低生產(chǎn)產(chǎn)品的整體非經(jīng)常性工程成本。小芯片方法使得無代工初創(chuàng)企業(yè)能夠專注于他們最為擅長的IP部分業(yè)務,而不必再為其它繁瑣而沉重的負擔分神。
我認為小芯片方案將成為無代工初創(chuàng)企業(yè)的發(fā)展助力,這也是DARPA在其贊助計劃當中希望達成的目標之一。事實上,DARPA目前正在全面啟動ERI,全稱為電子復興計劃。之所以全面介入,是因為DARPA意識到近年來原本領先的美國半導體技術在發(fā)展層面出現(xiàn)了萎縮,小型公司在這一市場上的創(chuàng)新能力受到影響。相關計劃的出臺,將為更多創(chuàng)新活動開辟道路,而無代工初創(chuàng)企業(yè)將成為其中最重要的受益群體。我認為這代表著未來的創(chuàng)新平臺,并將給整個半導體行業(yè)產(chǎn)生深遠的影響。正因為如此,我才將此視為半導體發(fā)展歷史上一段極為激動人心的時刻。接下來,我們將親眼見證眾多變化,而且有望抓住其中的寶貴機遇實現(xiàn)新一輪快速發(fā)展。
記者: 在初創(chuàng)企業(yè)與小型公司能夠真正參與這一生態(tài)系統(tǒng)之前,您認為小芯片將呈現(xiàn)出怎樣的發(fā)展速度?
Nagisetty:最近的不少事件都從側面給出了答案。比如剛剛建立的ODSA行業(yè)論壇,其全稱為開放特定領域架構(Open Domain-Specific Architectures)計劃。其正在成為開放計算項目這一行業(yè)協(xié)作體系中的重要組成部分。最近,我們還看到計算快速鏈接(簡稱CXL)倡議的出現(xiàn),旨在為加速器提供更為統(tǒng)一的接口標準。
就目前來看,半導體行業(yè)正在以加速器與封裝集成為出發(fā)點支持并建立起新的生態(tài)系統(tǒng),而相關措施的推進速度也相當驚人。我真的很難準確地預測未來,并告訴您這具體需要多長時間。但我個人猜測,時間也許不會太長,有可能只是幾年。畢竟在某些層面中,我們已經(jīng)看到了這一切逐步轉化為現(xiàn)實的早期證據(jù)。
記者: 小芯片最終是否需要將某種智能方法集成至基板或者封裝當中?
Nagisetty:這個嘛,我認為我們可以靜觀整個發(fā)展態(tài)勢。我認為這確實屬于一項架構決策,其中也存在著各種各樣的可能性。當談到將智能方法引入基板時,我們可以采用將一種智能方法堆疊在另一種之上的基板設計方案,這純粹就是一種互連設計。此外,也可能會出現(xiàn)分層結構,甚至是一種混合類型的基板,即將某種新的智能成果與相對較老的技術節(jié)點結合起來。總而言之,具體實現(xiàn)方法需要針對不同目標進行針對性優(yōu)化。
記者: 那么,英特爾公司接下來打算如何推動芯片技術的發(fā)展?
Nagisetty:哈哈,我能夠透露的只是,我們已經(jīng)在市場上進行了一定的展示,其基本涵蓋了我們接下來打算構建的幾乎所有產(chǎn)品用例。在這方面,我們擁有多種具體集成方案,而且也才剛剛朝著這個方向前進。但可以肯定的是,我們已經(jīng)將這些技術納入發(fā)展計劃當中,而且必將有能力在未來的幾代處理器方案當中不斷取得進步。