日前,一個聲稱其成員來自53家公司的組織舉辦了其第一次關(guān)于為加速器創(chuàng)建小芯片(chiplet)開放標準的研討會。該研討會的目的是在半導體發(fā)展步伐放緩的當下,實現(xiàn)SoC的低成本替代方案。
這個名為“開放特定領(lǐng)域架構(gòu)(ODSA)”的組織,隸屬于Facebook創(chuàng)建的開放計算項目(Open Compute Project)框架下,他們最近宣布了其第一個開源硅項目。但該項目正面臨技術(shù)難題和商業(yè)障礙,阻礙了其市場化動力,目前尚不清楚這項躊躇滿志的計劃能否獲得積極響應(yīng)和廣泛參與。
迄今為止,已經(jīng)有很多公司早早地創(chuàng)建了自己的 chiplet 生態(tài)系統(tǒng),包括Marvell的MoChi、英特爾的EMIB以及初創(chuàng)公司zGlue提供的產(chǎn)品。而且早在去年夏天,英特爾就已發(fā)布了針對其EMIB封裝技術(shù)的開源AIB協(xié)議,作為其DARPA研究計劃中小芯片研究的一部分。
Chiplet是業(yè)界為了彌補硅工藝技術(shù)增長放緩所做的幾項努力之一。 它們起源于多芯片模塊,誕生于20世紀70年代,最近在AMD的Ryzen和Epyc x86處理器等產(chǎn)品中作為一種節(jié)省成本的技術(shù)而重新煥發(fā)活力。
“目前所有的多芯片接口都是專有的。我們團隊想要建立的是一個開放接口,讓你可以組裝出最好的芯片,” Netronome工程師,同時也是ODSA的創(chuàng)始人Bapi Vinnakota表示,該公司旨在為OSDA組織提供多核網(wǎng)絡(luò)處理器中使用的800Gbps架構(gòu)提供寄存器傳輸級(RTL)設(shè)計。
作為一個開始,其他ODSA成員在研討會上提出以一個簡單的“線束”作為初始物理層接口,它可以以1、2或4 Gbits /秒/ pin的可選速率在有機基板上運行。
未來的接口還可能包括CCIX、112G和56G serdes以及RISC-V TileLink。該組織建議將來使用PCIe PIPE抽象層來實現(xiàn)各種協(xié)議和PHY物理層。盡管其成員主要精力在數(shù)據(jù)中心,但ODSA最終的目標也包括為移動和邊緣系統(tǒng)提供芯片。
ODSA的目標是圍繞PCIe創(chuàng)建快速概念驗證,同時定義其接口。(來源:ODSA)
該組織將研究相干和非相干內(nèi)存鏈路的混合應(yīng)用,并采用turbo模式實現(xiàn)雙向流量。 但它似乎拒絕了英特爾的AIB協(xié)議,因為其數(shù)據(jù)速率和引腳排列太有限。
ODSA計劃于年底前展示其基于PCIe的概念驗證。同時,它將充實其PHY、協(xié)議以及其他規(guī)范。建議工程師們可以在明年開始進行商業(yè)化的工作。
該組織還旨在為 chiplets 定義業(yè)務(wù)流程。ODSA的另一位創(chuàng)始人,NXP公司營銷總監(jiān)Sam Fuller表示,它將為不同的行業(yè)細分提供有價值的建議,并為已知合格芯片(KGD)定義測試認證。他補充說,ODSA還需要吸引包括封裝供應(yīng)商在內(nèi)的幾個主要參與者。
ODSA其他活躍成員還包括監(jiān)督概念驗證的FPGA供應(yīng)商Achronix公司和提供電源和散熱問題觀點的On Semiconductor公司。初創(chuàng)公司Kandou、SiFive和zGlue也是該組織的聯(lián)合創(chuàng)始公司。
大約有70人參加了ODSA首屆活動,其中約20人參加了直播活動。 “每隔兩、三個星期就會有四、五個新的有識之士參與進來,” 該組織的Vinnakota表示,該組織于2018年10月開始與七家公司合作。
三星曾在其北美總部舉辦的活動中討論到ODSA,并表示出其對該組織的支持。
“我們正在定義公司的chiplet策略,僅我個人而言,我看到了很多人對chiplet的濃厚興趣,”三星電子美洲戰(zhàn)略高級主管 Craig Orr說。
“我見過許多公司從3D堆疊中做出引人注目的東西,他們將晶圓最大限度切割并拼接在一起。還有許多網(wǎng)絡(luò)公司正在分離I/O芯片,這使得今天的serdes傳輸可以在未來切換到硅光子傳輸,“他說。
隨著成本的上升,“生產(chǎn)前沿工藝節(jié)點芯片的公司越來越少,因此如果我們可以通過采用 chiplet 降低成本,這將會給我們帶來更多的客戶,”他補充道。
對于Facebook和其他大型數(shù)據(jù)中心而言,定義硅芯片是定義一系列系統(tǒng)、電路板和模塊之后的下一個重大飛躍。隨著芯片發(fā)熱量上升,目前廣泛使用液體冷卻的價格也水漲船高,這讓他們倍感壓力。
包括AMD、英特爾、英偉達、Qualcomm、賽靈思和人工智能初創(chuàng)公司Graphcore和Habana等公司在內(nèi)的一個組織,與Facebook合作定義了一個用于冷卻高端芯片的模塊,這個模塊與一個大的咖啡馬克杯一樣大小,被稱為OCP加速器模塊(簡稱OAM),它的設(shè)計目標為最多容納8個芯片,在風冷系統(tǒng)中每個芯片的功率達到450W,在水冷系統(tǒng)中高達700W。
該模塊最初只是為追求高性能的AI機器培訓工作而設(shè)計,現(xiàn)在Facebook相信它也能用于推理系統(tǒng)。“我們提供了一個700W功率的選項,因為的確有公司在考慮采用,”Facebook硬件工程師Whitney Zhao表示,她談起了英偉達公司與一所大學研究的多芯片GPU。
“450W是頂線,高于450W,冷卻問題就可能對我們產(chǎn)生很大影響。液體冷卻對數(shù)據(jù)中心會產(chǎn)生巨大影響。 我們需要時間來構(gòu)建這個基礎(chǔ)設(shè)施 - 這是我們現(xiàn)在的主要議題之一?!?她說。
Open Compute成員已經(jīng)將各種系統(tǒng)用于加速器。(來源:ODSA)
與此同時,包括OAM在內(nèi),F(xiàn)acebook和微軟在他們的數(shù)據(jù)中心中使用了至少五種系統(tǒng)構(gòu)成封裝,而且還會有越來越多的系統(tǒng)構(gòu)成出現(xiàn)。Facebook和合作伙伴將在今年開始為新模塊定義通用基板、機箱和托盤。
“我們需要一個開放的加速器基礎(chǔ)架構(gòu),” Zhao說,她還提到她在參加ODSA會議后了了解芯片級選項。
對于芯片供應(yīng)商來說,越來越多的系統(tǒng)目標“令人大開眼界,我們的著陸區(qū)就是一份厚厚的菜單,”Netronome公司的Vinnakota說?!拔覀兊脹Q定我們的目標模塊,再搞清楚用哪些產(chǎn)品。簡單來說,答案是目前我們還沒有明確的想法,我們愿意接受任何幫助來搞清楚我們要的是什么?!?他補充說。