123,123,123

為什么IPU是英特爾加速布局云數(shù)據(jù)中心的關(guān)鍵一步？

日期： 2021-09-01

來源：與非網(wǎng)

關(guān)鍵詞： AIInsight IPU DPU

　　英特爾最新推出了IPU（基礎(chǔ)設(shè)施處理器），親自向CPU“下手”，進(jìn)行任務(wù)卸載。

　　從數(shù)據(jù)中心長(zhǎng)期的迭代方向來看，光網(wǎng)絡(luò)的鋪設(shè)、通信的密度、底層算力的生態(tài)設(shè)施建設(shè)等，都在逐漸升級(jí)的過程中。帶寬不斷提升、更大的數(shù)據(jù)量涌入，數(shù)據(jù)的處理越來越復(fù)雜，包括網(wǎng)絡(luò)協(xié)議處理、存儲(chǔ)壓縮、數(shù)據(jù)加密等，給CPU和GPU帶來更大挑戰(zhàn)。這些任務(wù)該由誰(shuí)來處理？這正是英特爾推出IPU、英偉達(dá)等推出DPU的大背景。

　　這些年來，英特爾憑借x86 CPU牢牢占據(jù)著數(shù)據(jù)中心的絕對(duì)地位。這一次，他親自下場(chǎng)給CPU卸載任務(wù)，有很多深層的原因值得發(fā)掘。雖命名不同于DPU，但從大體的功能職責(zé)來看，似乎并無太大異同。英特爾為什么選擇這個(gè)時(shí)候高調(diào)入局？有哪些野心？底氣又是什么？

　　為什么是IPU？

　　我的第一個(gè)問題就是關(guān)于命名，英特爾的IPU側(cè)重于基礎(chǔ)設(shè)施角度，而非業(yè)界廣泛提及的DPU（側(cè)重于數(shù)據(jù)），除了差異化的戰(zhàn)略考慮，還有哪些原因？

　　英特爾數(shù)據(jù)平臺(tái)事業(yè)部首席技術(shù)官Guido Appenzeller告訴<與非網(wǎng)>，IPU針對(duì)的是基礎(chǔ)設(shè)施處理功能，卸載CPU上用于基礎(chǔ)設(shè)施管理和虛擬化的任務(wù)，而不是去做特定的數(shù)據(jù)類型處理或AI負(fù)載，這是其與眾不同之處。英特爾與大型云服務(wù)提供商一直緊密合作，收到了很多的相關(guān)需求，因此英特爾和大型云服務(wù)提供商共同開發(fā)了這款I(lǐng)PU芯片，它是真正的客戶驅(qū)動(dòng)產(chǎn)品。在他看來，服務(wù)器眾多處理器都是針對(duì)數(shù)據(jù)的，AI處理器、CPU等都是處理數(shù)據(jù)，DPU（Data Processing Unit；數(shù)據(jù)處理器）并不準(zhǔn)確描述其功能定位。

　　英特爾研究院副總裁/中國(guó)研究院院長(zhǎng)宋繼強(qiáng)也表示，從IPU定位角度來講，它主要卸載的任務(wù)包括網(wǎng)絡(luò)虛擬化、存儲(chǔ)虛擬化，以及對(duì)網(wǎng)絡(luò)存儲(chǔ)進(jìn)行管理，要能夠很好地根據(jù)業(yè)務(wù)應(yīng)用的需求，虛擬化不同種類的任務(wù)，并且能夠提供相應(yīng)的接口或QS監(jiān)測(cè)。同時(shí)還要針對(duì)加密、解密等信息安全保障功能做卸載。

　　“IPU作為可編程的網(wǎng)絡(luò)設(shè)備，旨在使云和通信服務(wù)提供商減少在CPU方面的開銷，并充分釋放性能價(jià)值，都是和虛擬化基礎(chǔ)設(shè)施有關(guān)的”，宋繼強(qiáng)指出，“這就不能用單一產(chǎn)品去滿足所有需求，必須根據(jù)不同應(yīng)用和需要卸載的不同方式，采用不同的方案”。

　　IPU的更大野心：云服務(wù)提供商的新“彈藥”

　　越來越多的云數(shù)據(jù)中心，工作負(fù)載正在按照微服務(wù)集合的架構(gòu)進(jìn)行整合。雖然微服務(wù)導(dǎo)向的架構(gòu)有很多好處，但也因?yàn)榫酆系奶攸c(diǎn)，造成了大量的通信開銷，這種用于基礎(chǔ)設(shè)施開銷的CPU循環(huán)，并不會(huì)對(duì)云服務(wù)提供商的收入帶來增長(zhǎng)。Facebook的一篇論文顯示，超大規(guī)模數(shù)據(jù)中心的微服務(wù)開銷高達(dá)31-83%。

　　而通過基于IPU的架構(gòu)，云服務(wù)提供商可以把基礎(chǔ)設(shè)施任務(wù)從CPU轉(zhuǎn)移到IPU，釋放出的服務(wù)器CPU循環(huán)，則用來處理能夠帶來收益的任務(wù)，這樣就可以把數(shù)據(jù)中心獲得的收入最大化。

　　英特爾網(wǎng)絡(luò)與邊緣事業(yè)部副總裁、以太網(wǎng)產(chǎn)品部總經(jīng)理Patricia Kummrow近日撰文指出：云數(shù)據(jù)中心就像酒店，而不是家。類似于酒店劃分住客和員工活動(dòng)的不同區(qū)域，包含IPU的數(shù)據(jù)中心架構(gòu)也對(duì)租戶和云服務(wù)提供商的工作負(fù)載進(jìn)行區(qū)隔。通過把IPU引入數(shù)據(jù)中心來實(shí)施基礎(chǔ)設(shè)施功能，云服務(wù)提供商的基礎(chǔ)設(shè)施工作負(fù)載將在IPU上運(yùn)行，這就解除了服務(wù)器CPU的負(fù)擔(dān)，使其用于運(yùn)行更多租戶的應(yīng)用。

　　也正是如此，基于IPU的數(shù)據(jù)中心架構(gòu)具備以下優(yōu)勢(shì)：

可以嚴(yán)格分離基礎(chǔ)設(shè)施功能和租戶的工作負(fù)載，租戶可以全面掌控服務(wù)器CPU，并獲得其全部的性能。
通過把基礎(chǔ)設(shè)施任務(wù)轉(zhuǎn)移到IPU，云服務(wù)提供商可以把服務(wù)器CPU全部租賃給客戶。IPU專門處理基礎(chǔ)設(shè)施任務(wù)而不是通用任務(wù)，它可以應(yīng)用硬件加速并更精細(xì)地優(yōu)化計(jì)算，從而大幅提高性能和能效。
在傳統(tǒng)的企業(yè)數(shù)據(jù)中心架構(gòu)中，每臺(tái)服務(wù)器擁有自己的一套磁盤驅(qū)動(dòng)器和固態(tài)盤，而IPU能夠讓云數(shù)據(jù)中心實(shí)現(xiàn)全面的無磁盤服務(wù)器架構(gòu)。

　　這里要說明的是，如果采用全面的無磁盤模式，那么意味著所有存儲(chǔ)都由中央存儲(chǔ)服務(wù)提供。當(dāng)客戶在該服務(wù)器上啟動(dòng)一個(gè)工作負(fù)載時(shí)，云服務(wù)提供商就可以在存儲(chǔ)服務(wù)上創(chuàng)造一個(gè)虛擬卷。通過管理網(wǎng)絡(luò)，云服務(wù)提供商告訴IPU根據(jù)這個(gè)虛擬卷創(chuàng)建一個(gè)新的NVMe固態(tài)盤。在PCIe總線看來，這個(gè)虛擬NVMe固態(tài)盤就像是一個(gè)常規(guī)固態(tài)盤。而且，存儲(chǔ)服務(wù)器和服務(wù)器上的工作負(fù)載之間的實(shí)際存儲(chǔ)流量是在高速路徑上進(jìn)行的，這意味著不會(huì)涉及IPU或CPU上的任何內(nèi)核，時(shí)延低，擁有高吞吐量和更高的靈活性。

　　IPU更遠(yuǎn)的未來是ASIC芯片

　　英特爾最新推出的IPU方案基于兩種架構(gòu)類型：Mount Evans是專用ASIC架構(gòu)，Oak Springs Canyon（OSC）基于FPGA和Xeon D。

　　Mount Evans是英特爾第一款 ASIC IPU，與大型云服務(wù)提供商聯(lián)合設(shè)計(jì)開發(fā)。更值得一提的是，其CPU核心非常罕見地采用了Arm針對(duì)基礎(chǔ)設(shè)施推出的Neoverse N1內(nèi)核。

　　對(duì)此，Guido Appenzeller的評(píng)價(jià)是“這是一種是相當(dāng)務(wù)實(shí)的做法，英特爾總是評(píng)估能帶來性能、集成和功耗的最佳組合，在這種情況下，選擇Neoverse N1最適合。”

　　IPU涉及加速器以及其它很多技術(shù)，需要進(jìn)行快速數(shù)據(jù)包處理。Mount Evans包含兩個(gè)部分：網(wǎng)絡(luò)子系統(tǒng)和計(jì)算復(fù)合體。采用N1的16個(gè)高頻率內(nèi)核附帶由三個(gè)LPDDR4控制器支持的大型系統(tǒng)級(jí)緩存，這個(gè)計(jì)算復(fù)合體與網(wǎng)絡(luò)子系統(tǒng)密切結(jié)合，使得網(wǎng)絡(luò)子系統(tǒng)加速器能夠把系統(tǒng)級(jí)緩存用作最后一級(jí)緩存，以及提供兩者之間高帶寬、低時(shí)延連接，并能夠靈活地整合硬件和軟件數(shù)據(jù)包處理。

　　據(jù)介紹，Mount Evans IPU支持大量使用場(chǎng)景，例如vSwitch卸載、防火墻和虛擬路由等。通過擴(kuò)展英特爾傲騰NVMe控制器而開發(fā)的另外一項(xiàng)技術(shù)，讓Mt. Evans能夠模擬NVMe設(shè)備，在FPGA IPU上運(yùn)行的英特爾基礎(chǔ)設(shè)施操作系統(tǒng)也將能夠在Mount Evans上運(yùn)行。

　　Oak Springs Canyon（OSC）基于Agilex FPGA，Agilex在性能、功耗、工作負(fù)載效率等方面都有一定優(yōu)勢(shì)。OSC與基于至強(qiáng)CPU的服務(wù)器協(xié)同工作，提供卸載2x100G 工作負(fù)載所需的基礎(chǔ)設(shè)施加速，能夠滿足新興云服務(wù)提供商對(duì)于部署100GB工作負(fù)載的需求。

　　這種混合 IPU 架構(gòu)可以用硬件的速度進(jìn)行網(wǎng)絡(luò)管理，更高的軟件靈活性可以使用戶輕松實(shí)施控制面功能。使用 FPGA 板載資源的基于硬件的數(shù)據(jù)路徑，和基于軟件的控制平面與 IPU 的板載處理器上的基礎(chǔ)設(shè)施 OS 堆棧一起運(yùn)行，這種可編程性使IPU更靈活、性能更強(qiáng)。

　　“在美國(guó)和中國(guó)，六大云服務(wù)提供商目前使用基于FPGA的IPU，但我們看到，他們正在緩慢地轉(zhuǎn)向?qū)Ｓ肁SIC IPU”，Guido Appenzeller進(jìn)一步解釋，“FPGA帶來更大的靈活性，如果你希望實(shí)施一個(gè)特別的算法，就用FPGA，這對(duì)于很多云的服務(wù)來說很重要，目前排名前八的云全都使用不同的專有存儲(chǔ)協(xié)議，那么選擇FPGA是合理的，因?yàn)閷Ｓ眯酒恢С诌@種做法。 ”

　　而FPGA的一個(gè)劣勢(shì)是，編程門檻較高，客戶需要一個(gè)強(qiáng)大的團(tuán)隊(duì)，且吞吐量、功耗在一定程度上也會(huì)受到限制。隨著帶寬變高，未來的趨勢(shì)是使用更專用的ASIC IPU。

　　SmartNIC/DPU/IPU——一個(gè)越來越擁擠的賽道

　　從業(yè)界當(dāng)前發(fā)展DPU/IPU的思路來看，它作為一個(gè)可編程處理器，運(yùn)行的都是非應(yīng)用型負(fù)載，從而可以讓服務(wù)器CPU資源更好地服務(wù)應(yīng)用負(fù)載。如果再往前追溯，承擔(dān)此功能的還有SmartNIC，包括英特爾，也推出過Smart NIC智能網(wǎng)卡架構(gòu)。

　　IPU與SmartNIC的本質(zhì)差別是什么？Guido Appenzeller表示，主要區(qū)別在于IPU 具有本地控制平面，本質(zhì)上IPU是可以控制CPU的，當(dāng)CPU想要在網(wǎng)絡(luò)上發(fā)送一個(gè)數(shù)據(jù)包時(shí)，IPU 可確保此數(shù)據(jù)包位于特定的虛擬覆蓋網(wǎng)絡(luò)上，由IPU控制PCI總線，可以把虛擬設(shè)備展示給 CPU?；旧鲜怯?IPU 控制服務(wù)器，它是管理服務(wù)器的一部分，這也是信任的根源。而SmartNIC沒有CPU，它所做的就是卸載，更多地用于通信服務(wù)場(chǎng)景，由CPU 處于控制之中，SmartNIC是CPU控制系統(tǒng)。英特爾希望通過基于ASIC和基于FPGA的IPU方案，再結(jié)合SmartNIC，用這幾種綜合方案滿足不同基礎(chǔ)設(shè)施服務(wù)商的需求。

　　在英特爾看來，超大規(guī)模云服務(wù)提供商正在分階段實(shí)現(xiàn)IPU的價(jià)值：

第一階段：加速網(wǎng)絡(luò)——把虛擬交換機(jī)和防火墻等常見網(wǎng)絡(luò)任務(wù)從服務(wù)器CPU轉(zhuǎn)移到IPU。把流量查找和封裝/解封等用戶面功能（UPF）從CPU轉(zhuǎn)移到IPU，從而釋放CPU循環(huán)。
第二階段：加速存儲(chǔ)——把存儲(chǔ)堆棧從服務(wù)器CPU轉(zhuǎn)移到IPU，提高了存儲(chǔ)吞吐量，并降低了存儲(chǔ)的復(fù)雜性、開銷和管理負(fù)擔(dān)。
第三階段：加速安全——轉(zhuǎn)移加密/解密、壓縮和其它消耗服務(wù)器CPU循環(huán)的安全功能。（這些安全功能經(jīng)常與第二階段轉(zhuǎn)移的存儲(chǔ)功能搭配）。此外，IPU可以開啟主機(jī)系統(tǒng)的啟動(dòng)和配置，而通過隔離安全功能和提供與CPU分離的信任根，進(jìn)一步加強(qiáng)安全。
第四階段：基礎(chǔ)設(shè)施處理——或許是最精妙的用途，把虛擬機(jī)管理程序服務(wù)管理功能從CPU轉(zhuǎn)移到IPU。

　　加速網(wǎng)絡(luò)、存儲(chǔ)、安全再到基礎(chǔ)設(shè)施處理，這個(gè)方向不只是業(yè)界頭部廠商在關(guān)注，也成為一些創(chuàng)業(yè)公司扎堆的熱門領(lǐng)域。

　　“這顯然是一個(gè)大市場(chǎng)。長(zhǎng)遠(yuǎn)來看，幾乎每個(gè)云端服務(wù)器都會(huì)有類似 IPU 的產(chǎn)品”， Guido Appenzeller表示，“云服務(wù)提供商認(rèn)為IPU對(duì)他們來說是很好的投資。之前，如果是一個(gè)包含32個(gè)核心的CPU，他們需要把某些核心用于基礎(chǔ)設(shè)施處理，并不能把所有核心租給最終用戶。但是在采用IPU的情況下，用戶會(huì)得到額外的容量?；旧献屢粋€(gè)系統(tǒng)有更高密度的客戶工作負(fù)載，這在收益水平上對(duì)云服務(wù)提供商極具吸引力?！?/p>

　　在可以預(yù)見的未來，如果IPU確實(shí)分階段達(dá)到應(yīng)用效果，它將使云服務(wù)提供商出租CPU變得更容易，這也意味著人們會(huì)消費(fèi)更多技術(shù)，可能會(huì)進(jìn)一步拉動(dòng)CPU和GPU的使用需求，這何嘗不是幾條產(chǎn)品線的雙贏？IPU也將可能成為英特爾未來數(shù)據(jù)中心的戰(zhàn)略元件，成為其數(shù)據(jù)中心/云計(jì)算戰(zhàn)略的重要一步，進(jìn)一步提高性能、降低成本，提供更好的云數(shù)據(jù)中心架構(gòu)能力。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請(qǐng)及時(shí)通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

為什么IPU是英特爾加速布局云數(shù)據(jù)中心的關(guān)鍵一步？

日期： 2021-09-01

來源：與非網(wǎng)

相關(guān)內(nèi)容