123,123,123

是时候深入了解CXL了

日期： 2021-11-23

來源：半导体行业观察

關(guān)鍵詞： CXL

　　指數(shù)級數(shù)據(jù)增長促使半導(dǎo)體行業(yè)開始進(jìn)行突破性的架構(gòu)轉(zhuǎn)變，以從根本上改變數(shù)據(jù)中心的性能、效率和成本。

　　服務(wù)器架構(gòu)在過去幾十年來基本保持不變，現(xiàn)在，他們正朝著解決 AI/ML 應(yīng)用程序生成的 yottabytes 數(shù)據(jù)邁出革命性的一步。具體來說，數(shù)據(jù)中心正在從每臺服務(wù)器都有專用處理和內(nèi)存以及網(wǎng)絡(luò)設(shè)備和加速器的模型轉(zhuǎn)變?yōu)橹悄芷ヅ滟Y源和工作負(fù)載的分解“池”范式。

　　這種方法為數(shù)據(jù)中心提供了廣泛的好處，包括更高的性能、更高的效率和更低的總擁有成本（TCO）。盡管分解（或機(jī)架級架構(gòu)）和通用接口的概念已經(jīng)流傳了一段時間，但業(yè)界正在果斷地將 Compute Express Link （CXL）融合為處理器、內(nèi)存和加速器的緩存一致性互連。事實(shí)上，帶有 CXL 接口的新服務(wù)器架構(gòu)和設(shè)計(jì)很快就會進(jìn)入市場。

　　什么是Compute Express Link？

　　Compute Express Link （CXL）是一種開放標(biāo)準(zhǔn)的行業(yè)支持的緩存一致性互連，用于處理器、內(nèi)存擴(kuò)展和加速器的鏈接。從本質(zhì)上講，CXL 技術(shù)維護(hù) CPU 內(nèi)存空間和連接設(shè)備上的內(nèi)存之間的內(nèi)存一致性。這可以實(shí)現(xiàn)資源共享（或池化）以獲得更高的性能，降低軟件堆棧的復(fù)雜性，并降低整體系統(tǒng)成本。CXL 聯(lián)盟已經(jīng)確定了可從新互連中受益的三類主要設(shè)備：

　　類型 1 設(shè)備：智能 NIC 等加速器通常缺乏本地內(nèi)存。但是，它們可以利用 CXL.io 協(xié)議和 CXL.cache 與主機(jī)處理器的 DDR 內(nèi)存進(jìn)行通信。

　　類型 2 設(shè)備： GPU、ASIC 和 FPGA 都配備了 DDR 或 HBM 內(nèi)存，并且可以使用 CXL.memory 協(xié)議以及 CXL.io 和 CXL.cache，使主機(jī)處理器的內(nèi)存本地可用于加速器——并且加速器的內(nèi)存在本地可供 CPU 使用。它們還位于同一個緩存一致域中，有助于提升異構(gòu)工作負(fù)載。

　　類型 3 設(shè)備： CXL.io 和 CXL.memory 協(xié)議可用于內(nèi)存擴(kuò)展和池化。例如，連接到 CXL 總線的緩沖區(qū)可用于實(shí)現(xiàn) DRAM 容量擴(kuò)展、增加內(nèi)存帶寬或添加持久內(nèi)存，而不會丟失 DRAM 插槽。在現(xiàn)實(shí)世界中，這意味著以前取代 DRAM 的高速、低延遲存儲設(shè)備可以用支持 CXL 的設(shè)備代替它。這些可能包括各種形式因素的非易失性技術(shù)，例如附加卡、U.2 和 EDSFF。

　　CXL 協(xié)議和標(biāo)準(zhǔn)

　　Compute Express Link （CXL）標(biāo)準(zhǔn)通過三種協(xié)議支持各種用例，當(dāng)中包括：CXL.io、CXL.cache 和 CXL.memory。

　　CXL.io：該協(xié)議在功能上等同于 PCIe 5.0 協(xié)議，并利用了 PCIe 的廣泛行業(yè)采用和熟悉程度。作為基礎(chǔ)通信協(xié)議，CXL.io 用途廣泛，可解決廣泛的用例。

　　CXL.cache：該協(xié)議專為更具體的應(yīng)用程序而設(shè)計(jì)，使加速器能夠有效地訪問和緩存主機(jī)內(nèi)存以優(yōu)化性能。

　　CXL.memory：該協(xié)議使主機(jī)（例如處理器）能夠使用加載/存儲命令訪問設(shè)備連接的內(nèi)存。

　　這三種協(xié)議共同促進(jìn)了計(jì)算設(shè)備（例如 CPU 主機(jī)和 AI 加速器）之間內(nèi)存資源的一致共享。從本質(zhì)上講，這通過啟用共享內(nèi)存的通信來簡化編程。

　　Compute Express Link 與 PCIe 5：

　　這兩者有何關(guān)聯(lián)？

　　CXL 2.0 建立在PCIe 5.0的物理和電氣接口之上，其協(xié)議建立一致性、簡化軟件堆棧并保持與現(xiàn)有標(biāo)準(zhǔn)的兼容性。

　　具體來說，CXL 利用 PCIe 5 功能，允許備用協(xié)議使用物理 PCIe 層。當(dāng)啟用 CXL 的加速器插入 x16 插槽時，設(shè)備以默認(rèn)的 PCI Express 1.0 傳輸速率（2.5 GT/s）與主機(jī)處理器的端口協(xié)商。Compute Express Link 事務(wù)協(xié)議僅在雙方都支持 CXL 時激活。否則，它們將作為 PCIe 設(shè)備運(yùn)行。

　　根據(jù)VentureBeat 的Chris Angelini 的說法，CXL 和 PCIe 5 的對齊意味著這兩種設(shè)備類別都可以以 32 GT/s（每秒千兆傳輸）或高達(dá) 64 GB/s 的速度通過 16 通道鏈路在每個方向上傳輸數(shù)據(jù)。

　　Angelini 還指出，CXL 的性能需求很可能成為采用 PCIe 6.0 的驅(qū)動因素。

　　CXL 的特點(diǎn)和優(yōu)勢

　　簡化和改進(jìn)低延遲連接和內(nèi)存一致性可顯著提高計(jì)算性能和效率，同時降低 TCO。

　　此外，CXL 內(nèi)存擴(kuò)展功能可實(shí)現(xiàn)超出當(dāng)今服務(wù)器中緊密綁定的 DIMM 插槽的額外容量和帶寬。CXL 可以通過連接 CXL 的設(shè)備向 CPU 主機(jī)處理器添加更多內(nèi)存。當(dāng)與持久內(nèi)存配對時，低延遲 CXL 鏈接允許 CPU 主機(jī)結(jié)合 DRAM 內(nèi)存使用此額外內(nèi)存。大容量工作負(fù)載的性能取決于大內(nèi)存容量，例如 AI。

　　考慮到這些是大多數(shù)企業(yè)和數(shù)據(jù)中心運(yùn)營商正在投資的工作負(fù)載類型，CXL 的優(yōu)勢顯而易見。

　　CXL 2.0 規(guī)范：有什么新變化？

微信圖片_20211123120114.jpg

　　Compute express link （cxl）：內(nèi)存池圖 – Rambus

　?。?）內(nèi)存池

　　CXL 2.0 支持切換以啟用內(nèi)存池。使用 CXL 2.0 交換機(jī)，主機(jī)可以訪問池中的一個或多個設(shè)備。盡管主機(jī)必須啟用 CXL 2.0 才能利用此功能，但內(nèi)存設(shè)備可以是啟用 CXL 1.0、1.1 和 2.0 的硬件的混合。在 1.0/1.1 中，設(shè)備被限制為一次只能由一臺主機(jī)訪問的單個邏輯設(shè)備。但是，2.0 級別的設(shè)備可以分區(qū)為多個邏輯設(shè)備，最多允許 16 臺主機(jī)同時訪問內(nèi)存的不同部分。

　　例如，主機(jī) 1 （H1）可以使用設(shè)備 1 （D1）中一半的內(nèi)存和設(shè)備 2 （D2）中四分之一的內(nèi)存，以使其工作負(fù)載的內(nèi)存需求與內(nèi)存池中的可用容量精確匹配。設(shè)備 D1 和 D2 中的剩余容量可供一臺或多臺其他主機(jī)使用，最多可達(dá) 16 臺。設(shè)備 D3 和 D4（分別啟用 CXL 1.0 和 1.1）一次只能由一臺主機(jī)使用。

　　（2）交換

　　通過遷移到 CXL 2.0 直連架構(gòu)，數(shù)據(jù)中心可以獲得主內(nèi)存擴(kuò)展的性能優(yōu)勢，以及池化內(nèi)存的效率和總體擁有成本（TCO）優(yōu)勢。

　　假設(shè)所有主機(jī)和設(shè)備都支持 CXL 2.0，“交換”通過 CXL 內(nèi)存池芯片中的交叉開關(guān)合并到內(nèi)存設(shè)備中。這可以保持較低的延遲，但需要更強(qiáng)大的芯片，因?yàn)樗F(xiàn)在負(fù)責(zé)由交換機(jī)執(zhí)行的控制平面功能。

　　通過低延遲直接連接，連接的內(nèi)存設(shè)備可以使用 DDR DRAM 來擴(kuò)展主機(jī)主內(nèi)存。這可以在非常靈活的基礎(chǔ)上完成，因?yàn)橹鳈C(jī)能夠根據(jù)需要訪問任意數(shù)量的設(shè)備的全部或部分容量來處理特定工作負(fù)載。

　?。?）“按需”記憶范式

　　類似于拼車，CXL 2.0 根據(jù)“需要”為主機(jī)分配內(nèi)存，從而提供更高的內(nèi)存利用率和效率。該架構(gòu)提供了為標(biāo)稱工作負(fù)載（而不是最壞情況）配置服務(wù)器主內(nèi)存的選項(xiàng)，能夠在需要高容量工作負(fù)載時訪問池，并為 TCO 提供進(jìn)一步的好處。

　　最終，CXL 內(nèi)存池模型可以支持向服務(wù)器分解和可組合性的根本轉(zhuǎn)變。在這種范式中，計(jì)算、內(nèi)存和存儲的離散單元可以按需組合，以有效滿足任何工作負(fù)載的需求。

　?。?）完整性和數(shù)據(jù)加密（IDE）

　　分解（或分離服務(wù)器架構(gòu)的組件）會增加攻擊面。這正是 CXL 包含安全設(shè)計(jì)方法的原因。具體來說，所有三個 CXL 協(xié)議都通過提供機(jī)密性、完整性和重放保護(hù)的完整性和數(shù)據(jù)加密（IDE）來保護(hù)。IDE 在 CXL 主機(jī)和設(shè)備芯片中實(shí)例化的硬件級安全協(xié)議引擎中實(shí)現(xiàn)，以滿足 CXL 的高速數(shù)據(jù)速率要求，而不會引入額外的延遲。

　　應(yīng)該注意的是，CXL 芯片和系統(tǒng)本身需要防止篡改和網(wǎng)絡(luò)攻擊的保護(hù)措施。在 CXL 芯片中實(shí)現(xiàn)的硬件信任根可以為安全啟動和安全固件下載的安全性和支持要求提供此基礎(chǔ)。

　　為了推動CXL的發(fā)展，行業(yè)企業(yè)成立了一個CXL 聯(lián)盟。這是一個開放的行業(yè)標(biāo)準(zhǔn)組織，旨在開發(fā)技術(shù)規(guī)范，以促進(jìn)新興使用模型的突破性性能，同時支持?jǐn)?shù)據(jù)中心加速器和其他高速增強(qiáng)的開放生態(tài)系統(tǒng)。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

是时候深入了解CXL了

日期： 2021-11-23

來源： 半导体行业观察

相關(guān)內(nèi)容

來源：半导体行业观察