Xilinx 推出史上最強大加速器卡 Alveo U55C ,專為 HPC 與大數(shù)據工作負載打造
2021-11-18
來源:Xilinx
2021 年 11 月 16 日,中國北京———自適應計算的領先企業(yè)賽靈思公司(Xilinx, Inc.,(NASDAQ: XLNX))今日在全球超級計算大會( SC21 )上宣布,推出 Alveo? U55C 數(shù)據中心加速器卡,以及一款基于標準、API-driven 的集群解決方案,用于大規(guī)模部署 FPGA。Alveo U55C 加速器可為高性能計算( HPC )和數(shù)據庫工作負載提供卓越的單位功耗性能,同時還能通過賽靈思? HPC 集群解決方案簡便擴展。
圖:Xilinx Alveo U55C 加速器卡
全新Alveo U55C 卡專為 HPC 和大數(shù)據工作負載而構建,是賽靈思史上最強大的 Alveo 加速器卡,能夠提供 Alveo 加速器產品系列中的最高計算密度和 HBM 容量。結合賽靈思基于 RoCE v2 的全新集群解決方案,可令運行大規(guī)模計算工作負載的各類客戶大獲裨益,支持其利用現(xiàn)有數(shù)據中心基礎架構和網絡,實現(xiàn)強大的基于 FPGA 的 HPC 集群。
賽靈思執(zhí)行副總裁兼數(shù)據中心事業(yè)部總經理 Salil Raje 表示:“現(xiàn)在,針對目標 HPC 工作負載擴展 Alveo 計算能力比以往更簡單、更高效、更強大。在架構層面,以 Alveo 卡為代表的 FPGA 加速器,能夠以最低成本為眾多計算密集型工作負載提供最高性能。我們引入了基于標準的方法,其支持利用客戶的現(xiàn)有基礎架構和網絡創(chuàng)建 Alveo HPC 集群。借助這一方法,我們正將這些主要優(yōu)勢大規(guī)模應用于任意數(shù)據中心。這是實現(xiàn) Alveo 和自適應計算在數(shù)據中心更廣泛應用的一次重大飛躍。”
專為 HPC 和大數(shù)據應用打造
Alveo U55C 卡融合了當前 HPC 工作負載所需的眾多關鍵特性。它能提供更高的數(shù)據流水線并行度、卓越的存儲器管理、優(yōu)化的整個流水線的數(shù)據遷移,以及 Alveo 產品系列中最高的單位功耗性能。 Alveo U55C 卡采用單插槽、全高半長( FHHL )外形尺寸,最大功耗低至 150W。與前一代雙插槽Alveo U280 卡相比,Alveo U55C 提供了優(yōu)異的計算密度,還將 HBM2 容量翻倍至 16GB。U55C 以更小的外形尺寸提供了更高的算力,有助于創(chuàng)建基于 Alveo 加速器的密集集群。它專為需要性能擴展的高密度流式數(shù)據、高 I/O 數(shù)學和大型計算問題而開發(fā),例如大數(shù)據分析和 AI 應用。
圖:Xilinx Alveo U55C 加速器卡
通過利用 RoCE v2 和數(shù)據中心橋接技術,再結合 200 Gbps 帶寬,這款 API-driven 的集群解決方案使 Alveo 網絡可在性能和時延方面媲美 InfiniBand 網絡,且無需對廠商加鎖。MPI (信息傳遞接口)集成功能使 HPC 開發(fā)人員能以賽靈思 Vitis? 統(tǒng)一軟件平臺擴展 Alveo 數(shù)據流水線。利用現(xiàn)有開放標準和框架,現(xiàn)在能跨數(shù)百張 Alveo 卡上進行性能擴展,無需考慮服務器平臺和網絡基礎架構,同時還能共享工作負載和存儲器。
借助面向應用和集群的高層次編程,軟件開發(fā)者和數(shù)據科學家能夠運用 Vitis 平臺,解鎖 Alveo 和自適應計算的優(yōu)勢。賽靈思大力投入于 Vitis 開發(fā)平臺和工具流程,旨在令不具備硬件專業(yè)知識的軟件開發(fā)者和數(shù)據科學家,也能更容易地使用自適應計算。Vitis 平臺支持 Pytorch 和 Tensorflow 等主流 AI 框架,還支持 C、C++ 和 Python 等高層次編程語言,使開發(fā)者能利用特定 API 和庫來構建領域解決方案,或者使用賽靈思軟件開發(fā)套件,從而在現(xiàn)有數(shù)據中心內輕松加速關鍵 HPC 工作負載。
HPC 客戶用例
CSIRO 是澳大利亞的國立研究機構,擁有全球最大的射電天文望遠鏡天線陣列。CSIRO現(xiàn)正使用 Alveo U55C 卡,用于其平方公里陣列( Square Kilometer Array )射電望遠鏡的信號處理。將 Alveo 卡部署為配備 HBM 的網絡附加加速器,能夠在整個 HPC 信號處理集群中實現(xiàn)大規(guī)模吞吐量。基于 Alveo 加速器的集群使 CSIRO 能夠處理海量計算任務,從 13.1 萬根天線中實時聚合、過濾、準備和處理數(shù)據。420 張 Alveo U55C 卡通過支持 P4 語言的 100Gbs 交換機實現(xiàn)完全聯(lián)網,在整個信號處理集群中提供了 460GBs 的 HBM2 帶寬。Alveo U55C 集群的處理性能可達 15Tb/s 的總吞吐量,功耗更低且更具成本效益,顯著節(jié)省了成本。CSIRO 現(xiàn)正完成一項 Alveo 參考設計,以助力其他射電天文學或相鄰產業(yè)獲得同樣的成功。
圖:Xilinx Alveo U55C 加速器卡
Ansys LS-DYNA 碰撞仿真軟件幾乎用于全球所有的汽車公司。安全性和結構系統(tǒng)的設計往往取決于模型性能,因其能以計算機輔助設計有限元方法( FEM )仿真來降低物理碰撞測試的成本。FEM 求解器是驅動具備數(shù)億個自由度仿真的主要算法,而這些龐大的算法可以細分為更基本的求解器,如 PCG、稀疏矩陣、ICCG。與 x86 CPU 相比,利用超并行數(shù)據流水線在大量 Alveo 卡上進行性能擴展,LS-DYNA 能夠實現(xiàn)超過 5 倍的性能加速。這能在一個 Alveo 流水線中提高單位時鐘周期的工作效率,令 LS-DYNA 客戶受益于突破性的仿真時間。
Ansys 戰(zhàn)略合作伙伴總監(jiān) Wim Slagter 表示:“秉持不懈創(chuàng)新的精神,我們很高興與賽靈思展開合作,在我們的 LS-DYNA 仿真應用中大幅加速有限元求解器,表征隱式有限元方法 90% 的負載特性。我們期待在賽靈思加速的助力下,實現(xiàn)支持創(chuàng)新者設計未來的使命?!?br/>
TigerGraph 是一家領先的圖分析平臺提供商,正使用多張 Alveo U55C 卡為兩種最高效算法進行集群與加速,以驅動基于圖的推薦和集群引擎。對于數(shù)據科學家而言,圖數(shù)據庫可謂一種顛覆性平臺。圖從信息孤島中采集數(shù)據并重點關注數(shù)據間的關系。圖領域的下一個前沿是實時查找答案。Alveo U55C 將推薦引擎的查詢和預測時間從數(shù)分鐘縮短至數(shù)毫秒。與基于 CPU 的集群相比,使用多張 U55C 卡擴展分析所提供的出色計算能力和存儲器帶寬,可將圖查詢速度提升高達 45 倍。質量評分也提升高達 35%,從而顯著提升置信度,將誤報幾率降至低個位數(shù)。
產品供貨與輕松評估
Alveo U55C 卡目前可通過 China.xilinx.com 和賽靈思授權分銷商購買。該產品還可通過基于公有云的 FaaS( FPGA-as-a-Service,F(xiàn)PGA 即服務 )供應商進行簡便評估,也可以通過選定的托管數(shù)據中心進行專屬預覽。集群解決方案現(xiàn)已提供專屬預覽,預計將于明年第二季度全面問世。
賽靈思將于本周舉辦的全球超級計算大會( SC21 )上展示 Alveo U55C 加速器卡及合作伙伴解決方案。歡迎注冊 SC21,訪問賽靈思虛擬展臺。