包括AMD、ARM、華為(Huawei)、IBM、Mellanox、高通(Qualcomm)與賽靈思(Xilinx)等7家廠商近日宣布,將聯(lián)手針對伺服器加速器(server accelerators)聯(lián)手定義快取一致性互連架構(gòu)(cache-coherent interconnect)。
7家晶片供應(yīng)商近日宣布將聯(lián)手針對伺服器加速器(server accelerators)聯(lián)手定義快取一致性互連架構(gòu)(cache-coherent interconnect),在云端運算應(yīng)用領(lǐng)域提供英特爾(Intel)、Nvidia以外的替代方案。此舉是橫跨ARM、x86與Power架構(gòu)處理器的伺服器硬體架構(gòu)合作。
上述7家晶片廠商包括AMD、ARM、華為(Huawei)、IBM、Mellanox、高通(Qualcomm)與賽靈思(Xilinx),將聯(lián)手為定義伺服器加速器快取一致性互連(Cache Coherent Interconnect for Accelerators,CCIX)規(guī)格;該聯(lián)盟預(yù)計在今年底公布規(guī)格草案,但到目前為止并未公布任何關(guān)于此合作案的技術(shù)或財務(wù)細節(jié)。
英特爾在去年以167億美元收購了可程式化邏輯元件供應(yīng)商Altera,有部分原因就是為了使用后者的FPGA做為Xeon伺服器處理器的加速器;英特爾已經(jīng)開始推出在單一封裝中整合Altera之FPGA與其Xeon處理器的產(chǎn)品。至于其他處理器供應(yīng)商則是分別與賽靈思接洽,試圖為其晶片建立快取一致性連結(jié);于是Xilinx提出了定義適用所有處理器之單一連結(jié)的想法。
從去年開始,以加速器晶片來提高處理器性能的需求如野火般延燒整個運算產(chǎn)業(yè),大部分來自于各家網(wǎng)路巨擘開始在眾多新興應(yīng)用領(lǐng)域如語音識別、影像識別以及上下文搜尋等,采用新一代的機器學習演算法。
Google在甫落幕的年度Google I/O大會上也宣布已經(jīng)自行開發(fā)加速器晶片(參考閱讀),稱為張量處理單元(tensor processing unit,TPU);應(yīng)用于相對速度較低且非一致性快取的PCI Express匯流排。目前TPU已經(jīng)應(yīng)用于Google的資料中心處理各種任務(wù),被視為該公司云端服務(wù)的差異化特色之一。
微軟(Microsoft)與百度(Baidu)也已經(jīng)在資料中心使用FPGA,加速從搜尋引擎到網(wǎng)路安全性等不斷增加的任務(wù)處理速度;他們通常是在PCIe板卡上使用FPGA。而Nvidia今年稍早發(fā)表首款采用快取一致性連結(jié)介面NVLink的繪圖處理器Pascal;該介面用以連結(jié)Nvidia的GPU以及采用IBM Power架構(gòu)的處理器。
今年稍早,F(xiàn)acebook發(fā)表了以GPU為基礎(chǔ)、應(yīng)用于人工智慧任務(wù)的伺服器設(shè)計;而Google的一位頂尖工程師則于不久前透露(參考原文),該公司在資料中心采用越來越多數(shù)量的GPU。
除了機器學習,上述的CCIX組織成員表示,將開發(fā)的介面會有助于加速器進駐包括巨量資料分析、網(wǎng)路處理等應(yīng)用;特定功能加速器在協(xié)助通用處理器方面所扮演的角色重要性越來越顯著,因為后者若要趕上摩爾定律的步伐(Moore’s law),成本變得越來越高昂。CCIX標準可望應(yīng)用于廣泛的加速器與伺服器處理器,但合作成員都尚未透露具體計畫。
賽靈思表示該規(guī)格將應(yīng)用于16奈米制程FPGA,但未提及產(chǎn)品何時上市;Mellanox則可能會在高階網(wǎng)路控制器以及收購自EZChip的網(wǎng)路處理器都采用該規(guī)格。而IBM在今年稍早展示的、預(yù)計2017年問世之Power 9處理器電路圖(參考原文),其中的快取一致性介面應(yīng)該就是CCIX。
高通與華為可能會在開發(fā)中的ARM架構(gòu)伺服器單晶片采用新介面;AMD則應(yīng)該會在未來的ARM架構(gòu)與x86架構(gòu)伺服器處理器、還有Radeon繪圖處理器都采用CCIX,不過到目前為止AMD并未像是競爭對手Nvidia那樣著重GPU加速器的市場。
CCIX會是開放性FPGA應(yīng)用程式介面的補充
CCIX組織尚未決定其介面規(guī)格將會采用免費授權(quán)模式,或是將之交由經(jīng)認證的標準機構(gòu)來經(jīng)營;此外該組織也尚未透露任何關(guān)于介面頻寬、資料傳輸速率或延遲等方面的技術(shù)目標,僅表示相關(guān)參數(shù)至少都能與目前的其他替代方案媲美。
“我們將能與所有現(xiàn)存替代技術(shù)競爭,在某些應(yīng)用案例中甚至表現(xiàn)可以更好;”賽靈思架構(gòu)副總裁Gaurav Singh表示:“我們將有單一個跨越x86、Power與ARM架構(gòu)的一致性協(xié)議──這是以往從未有過的?!?/p>
網(wǎng)路巨擘如Google正準備探詢由英特爾x86架構(gòu)轉(zhuǎn)移至例如ARM或是Power架構(gòu)的可能性;今年稍早,一位微軟工程師表示,資料中心日益龐大的工作負載將迫使運算架構(gòu)重新設(shè)計,而有一部分焦點將集中在新種類的加速器。
最近開放源碼軟體開發(fā)商Red Hat正在主導重整針對包括FPGA在內(nèi)之伺服器加速器軟體編程介面的支援,對此Singh表示:“CCIX將與其行動互補;”他進一步指出:“CCIX不會定義應(yīng)用程式介面(API),那個部分將會由軟體業(yè)者來主導。CCIX會需要一些平臺軟體方面的改變來支援,但我們不預(yù)期會動到作業(yè)系統(tǒng)?!?/p>
“我們將因為擁有選擇性而獲益,有像是CCIX這樣的替代方案對產(chǎn)業(yè)界是好事;”Red Hat負責上述針對加速器之開放性編程介面的Jon Masters表示,CCIX提供了產(chǎn)業(yè)界需要的一些功能;是在英特爾的QPI以及IBM的CAPI (Coherent Accelerator Processor Interface)以外,另一個很不錯的替代技術(shù)。他指出在軟體部分,目標是定義使用加速器的開放性軟體介面,因此無論底層互連技術(shù)是QPI、PCI Express、CAPI或CCIX等等,都有免驅(qū)動程式的編程環(huán)境。
CCIX成員有大量現(xiàn)有技術(shù)可利用,例如ARM有一套一致性SoC互連,AMD主導的異質(zhì)系統(tǒng)架構(gòu)基金會(Heterogeneous Systems Architecture Foundation)為手機處理器的CPU、GPU開發(fā)了快取一致性連結(jié);此外IBM已經(jīng)在Power架構(gòu)晶片中使用一致性加速器處理器介面(即CAPI)。
市場研究機構(gòu)Moor Insights and Strategy的資深分析師Karl Freund認為,如果CCIX能順利推廣,潛在好處將會非常龐大;不過他預(yù)期最終成果可能要到2019年甚至2020年才會看到,因為該連結(jié)介面得等到IBM的Power 9、AMD的Zen以及ARM的新一代處理器核心問世之后才會現(xiàn)身。
而Freund也表示,推動CCIX的七家大廠還少了一家──Nvidia的缺席會在它們進入運算加速以及圍繞其軟體建立了有價值的生態(tài)系統(tǒng)時成為問題。