DPU被視為僅次于CPU、GPU的第三顆大芯片,負責處理“CPU做不好,GPU做不了”的數(shù)據(jù)任務(wù),預計全球DPU市場將在2023-2024年迎來爆發(fā)式增長。
繼AI芯片后,DPU(數(shù)據(jù)處理器)成半導體的新熱點。
全球芯片巨頭英偉達、英特爾先后下場,國內(nèi)涌現(xiàn)了中科馭數(shù)、云豹智能、大禹智芯、云脈芯聯(lián)、星云智聯(lián)、邊緣智芯等一系列創(chuàng)業(yè)公司,下游云計算龍頭AWS、阿里云等廠商也早已布局······DPU行業(yè)迎來百家爭鳴時期。
12月21日,中科馭數(shù)宣布完成數(shù)億元規(guī)模A+輪融資,由麥星投資和昆侖資本聯(lián)合領(lǐng)投。這是繼7月底完成A輪融資之后,該公司今年獲得的第二筆數(shù)億元融資;5月成立的云脈芯聯(lián)10月獲得IDG、壁仞科技等企業(yè)的投資。
DPU也在攪動著二級市場。21日,在左江科技回復投資者稱,公司自研可編程網(wǎng)絡(luò)安全處理芯片在功能定義和架構(gòu)設(shè)計上已具備DPU相關(guān)特性要求后,股價連漲三天。
在這一全新賽場上,國產(chǎn)DPU廠商有多大機會?誰能脫穎而出?
下一個黃金賽道?
在數(shù)據(jù)中心時代,CPU一家獨大的局面將一去不復返。
DPU被視為僅次于CPU、GPU的第三顆大芯片,負責處理“CPU做不好,GPU做不了”的數(shù)據(jù)任務(wù)。在英偉達等廠商的環(huán)伺下,英特爾在數(shù)據(jù)中心的市場將不斷被蠶食。
DPU的概念最早由硅谷創(chuàng)業(yè)公司Fungible提出,在英偉達收購網(wǎng)絡(luò)解決方案廠商Mellanox并重新包裝定義DPU后,這一概念一炮而紅。目前,該市場仍處于發(fā)展初期,各廠商定義有所不同。主流的DPU定義由NVIDIA提出,即DPU是集數(shù)據(jù)中心基礎(chǔ)架構(gòu)于芯片的通用處理器。
賽迪顧問發(fā)布的《2021中國DPU行業(yè)發(fā)展白皮書》將DPU方案分為三種:一是以通用眾核處理器為基礎(chǔ),以多核ARM為核心,以眾取勝,可編程靈活性較好,但是應(yīng)用針對性不夠,對于特殊算法和應(yīng)用的支持與通用CPU相比并無太顯著優(yōu)勢;二是以專用核為基礎(chǔ)的異構(gòu)核陣列,針對性較強、性能較好,但是犧牲了部分靈活性;第三種路線結(jié)合了前二者優(yōu)勢,即將通用處理器的可編程靈活性與專用的加速引擎相結(jié)合,正在成為最新的產(chǎn)品趨勢。
由于目前DPU的概念和技術(shù)標準并未統(tǒng)一,各家從自身優(yōu)勢出發(fā)輸出相應(yīng)的解決方案,形成百家爭鳴的競爭格局。
一方面,英偉達、英特爾、Marvell、博通等全球芯片龍頭積極布局,設(shè)立自己的標準;另一方面,眾多創(chuàng)業(yè)公司加入這一藍海。與此同時,包括AWS、阿里云等各大云服務(wù)廠商都在布局自己的數(shù)據(jù)處理器。
據(jù)第一財經(jīng)了解,全球最大云服務(wù)廠商AWS采用的是以Arm核為主的方案。2015年,AWS收購了Annapurna Labs,后者是為超大規(guī)模數(shù)據(jù)中心和邊緣計算設(shè)計基于Arm架構(gòu)芯片的廠商;2017年,AWS正式推出Nitro,將網(wǎng)絡(luò)、存儲和安全任務(wù)卸載到基于Arm架構(gòu)的專用設(shè)備上。
而阿里云提出的X-Dragon系統(tǒng)架構(gòu)核心MOC卡采用的則是FPGA+CPU的形式。有業(yè)內(nèi)人士表示,微軟早期采用的是純FPGA的方案,目前也在往FPGA+CPU方向轉(zhuǎn)。
除了自研,云廠商也通過投資等方式尋找合適的解決方案。例如,騰訊投資云豹智能,字節(jié)投資云脈芯聯(lián)。
大禹智芯CEO李爽告訴第一財經(jīng),目前DPU主流的市場方案包括以Arm核為主的架構(gòu)、FPGA+CPU架構(gòu),以及SoC架構(gòu),前兩者已經(jīng)在云計算廠商得到批量部署,整體SoC方案則是今后的趨勢,“我們自己的產(chǎn)品路線也按照這個來。FPGA+CPU的方案與第一代Arm核為主相比,接口的豐富度和處理性能要好很多,但是FPGA的功耗較大、價格較高。與此同時,我們的SoC項目已經(jīng)啟動?!?/p>
頭豹研究院預測,2025年全球DPU市場規(guī)模將達到135.7億美元,中國DPU市場規(guī)模將達到37.4億美元。
賽迪顧問的數(shù)據(jù)更樂觀。該機構(gòu)預計,全球DPU市場將在2023-2024年迎來爆發(fā)式增長,中國早于全球市場,于2022-2023年就將迎來爆發(fā)式增長。預計到2025年,全球DPU產(chǎn)業(yè)市場規(guī)模將超過245.3億美元,中國DPU產(chǎn)業(yè)市場規(guī)模將超過565.9億元。
有業(yè)內(nèi)人士認為,DPU數(shù)量會和服務(wù)器數(shù)量一個級別,每臺服務(wù)器都需要1個甚至多個DPU產(chǎn)品。
DPU的產(chǎn)生源自應(yīng)用驅(qū)動。摩爾定律放緩使得通用CPU性能增長的邊際成本迅速上升。中科馭數(shù)CEO鄢貴海表示,2010年前,網(wǎng)絡(luò)的帶寬年化增長大約30%,近年達到45%;而CPU的性能增長從10年前的23%,到近年降低至3%。當網(wǎng)絡(luò)帶寬增速和CPU性能增速的比例達到10倍的情形下,CPU幾乎已經(jīng)無法直接應(yīng)對網(wǎng)絡(luò)帶寬的增速。
“這個時代的核心變化是CPU性能增加趕不上數(shù)據(jù)產(chǎn)生的速度。2018年前,我如果買一個24核的CPU,有2個核處理流量,還有22個核可以處理上層應(yīng)用;2018年后流量快速增加,需要16核處理流量,處理其他任務(wù)的只有8個核,幾乎2/3就廢掉了?!边吘壷切臼紫軜?gòu)師李甫告訴第一財經(jīng)。
在大型數(shù)據(jù)中心,流量處理占了計算30%的資源,AWS將這些還未運行業(yè)務(wù)程序,先接入網(wǎng)絡(luò)數(shù)據(jù)就要占去的計算資源稱為“數(shù)據(jù)中心稅(Datacenter Tax)”。
DPU最直接的作用是作為CPU的卸載引擎,接管網(wǎng)絡(luò)虛擬化、硬件資源池化等基礎(chǔ)設(shè)施層服務(wù),從而釋放寶貴的CPU資源來運行上層應(yīng)用,實現(xiàn)了以數(shù)據(jù)為中心的業(yè)務(wù)和基礎(chǔ)設(shè)施操作的分離。
芯片巨頭爭霸
2020年10月,在收購Mellanox后,英偉達發(fā)布了首款DPU產(chǎn)品——BlueField2系列。英偉達創(chuàng)始人兼CEO黃仁勛表示:“現(xiàn)代超大規(guī)模云正在推動數(shù)據(jù)中心的新架構(gòu)。需要一種旨在處理數(shù)據(jù)中心基礎(chǔ)設(shè)施軟件的新型處理器來卸載和加速虛擬化、網(wǎng)絡(luò)、存儲、安全和其它云原生AI服務(wù)的巨大計算負載。BlueField DPU的時代已經(jīng)到來?!?/p>
英偉達規(guī)劃了多代產(chǎn)品,計劃在2022年推出性能更強的BlueField3,2024年推出集成其GPU模塊的BlueField4。
從戰(zhàn)略上,英偉達收購Mellanox推出DPU,并試圖收購Arm,加上其傳統(tǒng)強項GPU,將侵蝕英特爾的市場份額,直接威脅后者在數(shù)據(jù)中心的霸主地位。
股市上的表現(xiàn)更加直接。2020年7月,英偉達市值超過英特爾,成為全球第三大半導體企業(yè);一年多后的今天,英偉達成為全球市值最高的半導體企業(yè)。截至北京時間12月28日,英偉達市值7736億美元,幾乎是英特爾(市值2112億美元)的4倍。
不過,英偉達是否能成功復制GPU的成功仍有待觀察。多位業(yè)內(nèi)人士告訴第一財經(jīng),此前Mellanox產(chǎn)品在云服務(wù)廠商的認可度并不高,“它的劣勢是它確實不太懂(云),包括客戶對它產(chǎn)品的測試和設(shè)計都有吐槽。在Mellanox尚未被收購前,我們有測過很多功能,一些功能的改變也是我們提的?!?/p>
不少人認為,英偉達對DPU市場的教育和推動概念的作用要大于其產(chǎn)品的實際應(yīng)用。
在英偉達的步步緊逼下,英特爾自然也不甘落后。2021年6月,英特爾發(fā)布了IPU(Infrastructure Processing Unit,基礎(chǔ)設(shè)施處理器),對標英偉達的DPU,并推出了基于FPGA和ASIC的兩種方案。
Guido Appenzeller介紹稱,在美國和中國,六大云服務(wù)廠商目前使用基于FPGA的IPU?!半S著帶寬變高,我們看到他們緩慢地轉(zhuǎn)向?qū)S肁SIC IPU。因為存在很多專利協(xié)議,所以不會發(fā)生快速轉(zhuǎn)變。”
通過使用IPU,可以從服務(wù)器卸載與運行基礎(chǔ)設(shè)施任務(wù)相關(guān)的開銷。云服務(wù)廠商的軟件在IPU本身上運行,而租戶的應(yīng)用程序在服務(wù)器CPU上運行。這不僅釋放了服務(wù)器上的資源,同時優(yōu)化了整體性能,而且為云廠商提供了一個單獨且安全的控制點。
值得一提的是,ASIC版本IPU采用的CPU核是ARM架構(gòu),而非英特爾自身的X86架構(gòu),這意味著英特爾的話語權(quán)正在減弱,為了迎合客戶需求選用了競爭對手的架構(gòu)。
第一財經(jīng)了解到,英特爾ASIC版本IPU主要與谷歌合作,谷歌提出相應(yīng)需求,英特爾為其“定制”。
李甫認為,IPU側(cè)重多個CPU的管理,努力融合IaaS模塊,降低集群管理成本,更多像是一個協(xié)處理器。“類似在CPU中的大小核,變成了雙路服務(wù)器中的雙路大小CPU架構(gòu)。為了應(yīng)對不同客戶需求,英特爾可能會采用FPGA +小CPU +大CPU的超異構(gòu)計算模型,復雜化DPU/IPU市場。我們推出基于PCIe Switch總線交換技術(shù)的XPU芯片,正是為了這種超異構(gòu)計算架構(gòu)準備的通用數(shù)據(jù)分發(fā)芯片。”
除此之外,賽靈思、Marvell、博通等老牌芯片廠商也都在推出針對數(shù)據(jù)中心的解決方案。
國內(nèi)創(chuàng)業(yè)公司遍地開花
國內(nèi)初創(chuàng)企業(yè)也陸續(xù)推出相應(yīng)的解決方案。中科馭數(shù)自主研發(fā)KPU芯片架構(gòu),落地于金融計算、數(shù)據(jù)中心、云原生、5G邊緣計算等場景。該公司正在研發(fā)的第二代DPU芯片K2已經(jīng)完成設(shè)計和驗證工作,預計將于2022年第一季度投產(chǎn)流片。
12月4日,大禹智芯第一代DPU產(chǎn)品Paratus V1.0正式亮相。根據(jù)該公司規(guī)劃,2021年,大禹智芯完成第一代產(chǎn)品的研發(fā)、客戶測試和商業(yè)化交付;2021年年底,第二代產(chǎn)品即將成功研發(fā),并實現(xiàn)對應(yīng)商業(yè)合同的簽署;2021年年底,大禹智芯啟動自有芯片(SoC方案)的研發(fā)。
12月15日,云豹智能發(fā)布全功能云霄DPU網(wǎng)卡,全面支持裸金屬、虛擬機和容器服務(wù)資源一體化和性能加速,主要基于FPGA方案。據(jù)悉,下一代軟件定義DPU芯片也正在按計劃研發(fā)中。
專注PCIe技術(shù)棧的邊緣智芯則提供了另一種視角,數(shù)據(jù)從網(wǎng)卡進入其設(shè)計的XPU后,分發(fā)給CPU、GPU、SSD。按其架構(gòu),在XPU為中心的架構(gòu)中,網(wǎng)卡無需智能,只需要提供基本的網(wǎng)絡(luò)協(xié)議功能即可,適用于低成本、低延遲的應(yīng)用場景。
與CPU和GPU不同,DPU目前在技術(shù)標準和生態(tài)方面都處于早期階段,并未出現(xiàn)絕對的領(lǐng)先者。接受采訪的多位業(yè)內(nèi)人士認為,中國具備豐富的數(shù)據(jù)資產(chǎn),有強大的互聯(lián)網(wǎng)產(chǎn)業(yè),在這一賽道中,中國芯片廠商或許有望脫穎而出。