本文作者: 米樂
本文來源:半導(dǎo)體產(chǎn)業(yè)縱橫
原文鏈接:https://mp.weixin.qq.com/s/I86D8zWpPQIMSgqEc5DKig
日前,華為輪值董事長胡厚崑說道,科技革命經(jīng)過了數(shù)次浪潮,從互聯(lián)網(wǎng)到移動化到云計算、到人工智能,每一輪的變革都給社會帶來了深遠的影響。毫無疑問,今天通用人工智能(AI)正給我們無窮的想象空間,也正帶領(lǐng)我們走進下一個黃金十年。
當前,人工智能、大數(shù)據(jù)應(yīng)用進入快速發(fā)展階段,自動駕駛、機器人、AR/VR、元宇宙等應(yīng)用加速落地,傳統(tǒng)數(shù)字基礎(chǔ)設(shè)施難以滿足大模型、多模態(tài)等新型技術(shù)發(fā)展,擁有強大集群算力的新型數(shù)據(jù)中心成為突破人工智能發(fā)展瓶頸的重要基礎(chǔ)。
DPU作為突破數(shù)據(jù)流量指數(shù)級增長帶來的性能瓶頸的關(guān)鍵技術(shù),通過算力卸載、算力釋放和算力拓展,釋放CPU的計算資源,實現(xiàn)任務(wù)加速處理,提升整體計算效率,達到降本增效,產(chǎn)業(yè)賦能價值凸顯。因此,也成為構(gòu)建新型算力基礎(chǔ)設(shè)施的重要基礎(chǔ)部件和下一代芯片技術(shù)競爭的高地。
DPU也被預(yù)測為2023年的十大科技趨勢之一,這份“洪荒之力”發(fā)展的如何呢?
01
“新貴”是怎樣練成的
有人說,DPU 將成為未來計算的三大支柱之一,未來的數(shù)據(jù)中心標配是:CPU + DPU + GPU 。
DPU 最直接的作用是作為 CPU 的卸載(offload)引擎,其效果是給 CPU“減負”。《DPU技術(shù)白皮書》主編、中國科學(xué)院計算所研究員鄢貴海作了一個形象比喻,說DPU 提供了數(shù)據(jù)中心一把“殺雞”的工具,節(jié)省的是 CPU 這把“牛刀”,以釋放 CPU 算力,留給更需要它的業(yè)務(wù)負載。這個比喻也形象地說明了DPU這個新貴的定位。
DPU 通過執(zhí)行以下主要功能為現(xiàn)代數(shù)據(jù)中心帶來許多好處:
一、提高處理能力: DPU 減輕 CPU 的網(wǎng)絡(luò)和通信工作負載,從而釋放資源用于應(yīng)用程序處理。
二、提高效率和性能: 通過將處理核心與硬件加速器塊相結(jié)合來大規(guī)模處理以數(shù)據(jù)為中心的工作負載,DPU 可以提高性能并減少延遲。
三、處理復(fù)雜任務(wù)的能力: DPU 旨在處理大型數(shù)據(jù)中心中的數(shù)據(jù)密集型工作負載,支持云環(huán)境或驅(qū)動人工智能、深度學(xué)習(xí)算法和其他數(shù)據(jù)密集型應(yīng)用的超級計算機。
四、能夠滿足數(shù)據(jù)中心不斷增長的需求: 隨著數(shù)據(jù)中心需求的增長和變得更加密集,DPU 可以進行擴展,以適應(yīng)數(shù)量和復(fù)雜性不斷增加的工作負載。此外,DPU 可以添加到現(xiàn)有的硬件基礎(chǔ)設(shè)施中,從而實現(xiàn)靈活且適應(yīng)性強的數(shù)據(jù)中心架構(gòu)。
五、提高可靠性和可用性: DPU 可以通過冗余和高可用性等功能提供更高的可靠性,確保在發(fā)生硬件故障時關(guān)鍵數(shù)據(jù)處理任務(wù)的連續(xù)性。
六、降低成本: DPU 可以通過從 CPU 卸載處理任務(wù)并處理復(fù)雜任務(wù)來降低與管理數(shù)據(jù)中心相關(guān)的總體硬件成本,從而需要更少的硬件組件。
DPU、CPU 和 GPU 之間有什么區(qū)別呢?
首先在功能上, DPU(數(shù)據(jù)處理單元)、CPU(中央處理單元)和GPU(圖形處理單元)都是計算處理器,各自執(zhí)行不同的功能。CPU是負責(zé)計算機系統(tǒng)整體運行的主處理器,是計算機的“大腦”。GPU 是用于圖形計算任務(wù)(例如渲染3D 圖像或視頻)的專用處理器。DPU 是最新的處理器,專門用于以數(shù)據(jù)為中心的工作負載,例如數(shù)據(jù)中心的網(wǎng)絡(luò)、存儲和安全操作。
其次是架構(gòu),CPU 由幾個強大的處理核心組成,這些核心針對串行或順序處理進行了優(yōu)化,這意味著一項又一項任務(wù)。GPU 具有大量針對并行處理(即同時執(zhí)行任務(wù))進行優(yōu)化的更簡單的內(nèi)核。DPU 結(jié)合了處理核心、硬件加速器塊和高性能網(wǎng)絡(luò)接口,可大規(guī)模處理以數(shù)據(jù)為中心的任務(wù)。
另外,CPU 幾乎用于所有計算機設(shè)備,從智能手機到計算機再到服務(wù)器。GPU 經(jīng)常用于游戲電腦。DPU 主要用于數(shù)據(jù)中心。
基于明顯的優(yōu)勢,國外大廠已經(jīng)早早地開始發(fā)展DPU了。
2019年,英偉達以69億美元的價格收購以色列網(wǎng)絡(luò)芯片公司Mellanox,并于同年推出BlueField-2 DPU,自此拉開DPU高速發(fā)展的序幕。
在 2020 年 GPU 技術(shù)大會上,英偉達首席執(zhí)行官黃仁勛推出了名為 BlueField-2 數(shù)據(jù)處理單元 (DPU) 的全新處理器系列。開發(fā)人員可以通過軟件平臺 DOCA SDK 訪問 DPU。DPU和DOCA SDK可與英偉達GPU硬件和CUDA軟件的強大組合相媲美。
7月11日業(yè)內(nèi)四名知情人士報道,歐盟監(jiān)管機構(gòu)將于本周三批準博通以690億美元收購軟件制造商VMware的交易。報道稱,歐盟委員會將接受博通的讓步,即VMware的軟件將繼續(xù)與競爭對手的硬件兼容。知情人士表示,這一舉措已被證明足以解決歐盟競爭監(jiān)管機構(gòu)的擔(dān)憂,而無需博通出售VMware的部分業(yè)務(wù)。
這次的收購如果成功,博通就可以進一步進軍數(shù)據(jù)中心市場,特別是數(shù)據(jù)處理單元(DPU)市場,也稱為智能網(wǎng)絡(luò)接口卡(smartNIC)市場。VMware也一直在尋找自己的DPU/smartNIC市場之路。自 2020 年以來,該公司一直致力于一項名為 Project Monterey 的項目,研究其虛擬化軟件如何與 DPU 配合使用。
2022年 3 月,高級技術(shù)營銷架構(gòu)師 Dave Morera 對該項目的描述是:“根據(jù) VMware 的蒙特利項目,網(wǎng)絡(luò)流量、分布式防火墻等網(wǎng)絡(luò)進程將被卸載到SmartNIC (智能網(wǎng)絡(luò)接口卡);這意味著不僅 x86 服務(wù)器的資源被繞過,流量本身也被繞過。蒙特利項目還將促進在 DPU 本身上安裝 ESXi 和NSX,從而將所需的 CPU 資源從 x86 卸載到 DPU,不僅釋放 x86 上的資源供虛擬機使用,而且還提供額外的安全層”。
除了英偉達之外,下表展示了其他國際廠商的DPU產(chǎn)品。
02
國內(nèi)DPU起勢猛
雖然國內(nèi)廠商在芯片產(chǎn)品化的環(huán)節(jié)與國外一線廠商相比還有差距,但是在DPU架構(gòu)的理解上還是有獨到的見解的,而且我國目前在數(shù)據(jù)中心這個領(lǐng)域,無論是市場規(guī)模還是增速,特別是用戶數(shù)量,相較于國外都有巨大的優(yōu)勢。國內(nèi)廠商有望充分利用這一市場優(yōu)勢,加快發(fā)展步伐,在DPU這個賽道與國外廠商逐鹿中原。
國內(nèi)廠商在啃的是一塊新的“硬骨頭”。DPU技術(shù)的特點是燒錢多、周期長、產(chǎn)品面向政企、很難快速上量,但是技術(shù)壁壘高、客戶黏性強。同時, DPU是全球新近發(fā)展起來的一項新技術(shù),不像很多成熟芯片已經(jīng)形成了“西強東弱”的格局,在DPU上中國和西方國家沒有代際差。
也就是說DPU是全球新近發(fā)展起來的一種專用處理器。國內(nèi)廠商的一些產(chǎn)品處在從小批量到規(guī)?;瘧?yīng)用的階段,已經(jīng)有了第一批客戶。當下的任務(wù)是,保持產(chǎn)品迭代以適應(yīng)用戶需求。同時,推動產(chǎn)品從小批量到規(guī)?;涞?再要考慮如何去復(fù)制同類客戶。
然而DPU產(chǎn)業(yè)化的挑戰(zhàn)很大,這包括一些供應(yīng)鏈緊張、人才不足的共性難題,還有需求碎片化、大量兼容適配的特殊挑戰(zhàn),目前單顆DPU成本較高。
與存儲器、CPU這種成熟產(chǎn)品不同,這些芯片已經(jīng)被標準化,國際大廠擁有技術(shù)的、成本的優(yōu)勢,并善于利用產(chǎn)品的周期性調(diào)整價格,以驅(qū)逐追趕者。國產(chǎn)的道路是后發(fā)追趕式的,面臨的競爭非常殘酷。
DPU未來也會走向標準化。中科馭數(shù)公司的創(chuàng)始人兼 CEO鄢貴海說:“我們感受到的競爭氛圍更寬松,而且創(chuàng)新的空間更大,比如我們正在研究如何將端到端的延遲從20微秒降低到2微秒,對于很多技術(shù)點,各家都有不同的實現(xiàn)方法,但若這項技術(shù)在國際上已經(jīng)相對成熟,那國產(chǎn)幾乎沒有空間去創(chuàng)新了,最緊要的任務(wù)就是趕上國際的水平,做出一個自主可控的方案?!?/p>
在全球格局尚未形成之前,國產(chǎn) DPU 需要利用國內(nèi)的資源稟賦和更多國產(chǎn)芯片達成生態(tài)協(xié)同,并服務(wù)于本土的信息基礎(chǔ)設(shè)施,在全球角逐一項新技術(shù)的關(guān)鍵窗口期,探索出一種“中國方案”。
其中“定制化方案”就是國產(chǎn)DPU很好的發(fā)展方向和布局思路。DPU是個新興市場,客戶需求還處于粗放階段,各種方案都有適合的應(yīng)用場景。因為玩家不多,客戶需求比較分散,單個廠商無法服務(wù)眾多客戶,因此現(xiàn)階段都能夠通過為客戶進行定制化服務(wù)獲得訂單。
國內(nèi)未來DPU的發(fā)展和布局應(yīng)采取一些差異化競爭思路,一方面,加快自主研發(fā)DPU的進程。不管是處理器架構(gòu)的研發(fā),還是網(wǎng)絡(luò)芯片的研發(fā),都要加快產(chǎn)品的迭代速度。另一方面,在商業(yè)模式上,找一些細分的產(chǎn)品角度進行創(chuàng)新。多與國內(nèi)的云計算、數(shù)據(jù)中心的廠商合作,先進行小批量的產(chǎn)品鋪設(shè),再進行大規(guī)模的布局。
更多精彩內(nèi)容歡迎點擊==>>電子技術(shù)應(yīng)用-AET<<