升級電源和機(jī)架架構(gòu),滿足AI服務(wù)器的需求
2025-02-28
作者:Sam Abdel-Rahman 英飛凌科技電源與傳感系統(tǒng)事業(yè)部 高級首席系統(tǒng)架構(gòu)師
來源:英飛凌
英飛凌的CoolSiC?和CoolGaN?產(chǎn)品非常適用于應(yīng)對數(shù)據(jù)中心機(jī)架和電源供應(yīng)單元(PSU)電力需求增長所需的新架構(gòu)和AC-DC配電配置。
作者:Sam Abdel-Rahman 英飛凌科技電源與傳感系統(tǒng)事業(yè)部 高級首席系統(tǒng)架構(gòu)師
前言
人工智能(AI)的迅猛發(fā)展推動了數(shù)據(jù)中心處理能力的顯著增長。如圖1所示,英飛凌預(yù)測單臺GPU的功耗將呈指數(shù)級上升,預(yù)計到2030年將達(dá)到約2000 W [1],而AI服務(wù)器機(jī)架的峰值功耗將突破驚人的300 kW。這一趨勢促使數(shù)據(jù)中心機(jī)架的AC和DC配電系統(tǒng)進(jìn)行架構(gòu)升級,重在減少從電網(wǎng)到核心設(shè)備的電力轉(zhuǎn)換和配送過程中的功率損耗。
圖1:基于x86和Arm?架構(gòu)的服務(wù)器CPU與GPU和TPU的電力需求對比
圖2(右)展示了開放計算項目(OCP)機(jī)架供電架構(gòu)的示例。每個電源架由三相輸入供電,可容納多臺PSU;每臺PSU由單相輸入供電。機(jī)架將直流電壓(例如,50 V)輸出到母線,母線則連接到IT和電池架。
AI的發(fā)展趨勢要求對PSU功率進(jìn)行革新,如圖2(左)所示。接下來,我們將通過各代PSU的拓?fù)浣Y(jié)構(gòu)和器件技術(shù)建議示例,來逐步介紹這些PSU的演變。
圖2 :AI服務(wù)器PSU的功率演變(左);服務(wù)器機(jī)架架構(gòu)示例(右)
AI服務(wù)器機(jī)架PSU的趨勢和功率演進(jìn)
第一代AI PSU:在相同的架構(gòu)下提升功率,~5.5-8 kW、50 Vout、277 Vac、單相
當(dāng)前的AI服務(wù)器PSU大多遵循ORv3-HPR標(biāo)準(zhǔn)[9]。相較于先前的ORv3 3 kW標(biāo)準(zhǔn)[9],該標(biāo)準(zhǔn)的大部分要求(包括輸入和輸出電壓以及效率)保持不變,但增加了與AI服務(wù)器需求相關(guān)的更新,例如,更高的功率和峰值功率要求(稍后詳述)。此外,由于與BBU架的通信方式有所調(diào)整,輸出電壓的調(diào)節(jié)范圍變得更窄。
盡管每個電源架都通過三相輸入(400-480 Vac L-L)供電(見圖2),但每臺PSU的輸入仍為單相(230-277 Vac)。圖3展示了符合ORv3-HPR標(biāo)準(zhǔn)的第一代PSU的部署示例:PFC級可以采用兩個交錯的圖騰柱拓?fù)浣Y(jié)構(gòu),其中,650 V CoolSiC? MOSFET用于快臂開關(guān),600 V CoolMOS? SJ MOSFET用于慢臂開關(guān)。DC-DC級可以選用650 V CoolGaN?晶體管的全橋LLC,次級全橋整流器和ORing則使用80 V OptiMOS? Power MOSFET。此外,示例還展示了一個中間級,也稱“延長保持時間”或“小型升壓”,其作用是減小大容量電容器的尺寸。該中間級由一個升壓轉(zhuǎn)換器組成,在線路周期掉電事件期間,通過儲能電容器放電,以調(diào)節(jié)LLC輸入電壓。在正常運(yùn)行期間,升壓轉(zhuǎn)換器保持空閑狀態(tài),并通過低阻抗的600 V CoolMOS? SJ MOSFET旁路。
圖3:第一代AI PSU的拓?fù)浣Y(jié)構(gòu)及器件技術(shù)示例
第二代AI PSU:增加線路電壓,以實(shí)現(xiàn)更高的功率,~8-12 kW、50 Vout、277–347 Vac、單相
如上所述,隨著機(jī)架功率增加到300 kW以上,電源架的功率密度變得至關(guān)重要。因此,下一代PSU的設(shè)計方向是,在單相架構(gòu)中實(shí)現(xiàn)8 kW至12 kW的輸出功率。隨著每個機(jī)架的功率增加,數(shù)據(jù)中心中的機(jī)架數(shù)量在某些情況下,可能會受配電電流額定值和損耗的約束。因此,為了降低交流配電的電流和損耗,部分?jǐn)?shù)據(jù)中心可能會將機(jī)架的交流配電電壓從400/480 V提高到600 Vac L–L(三相),同時將PSU的輸入電壓從230/277 Vac提高到 347 Vac(單相)。
雖然這一變化有利于數(shù)據(jù)中心的運(yùn)行效率和資源利用,但會影響PSU的額定電壓和設(shè)計。在347 Vac的輸入電壓下,PFC的輸出電壓必須設(shè)定在575 Vdc左右,這意味著傳統(tǒng)的650 V器件的額定電壓已無法滿足要求。圖4展示了一個示例:第一代 PSU使用的兩電平圖騰柱PFC被替換為400 V CoolSiC? MOSFET 的三電平飛電容圖騰柱PFC(3-L FCTP PFC)級。多電平功率轉(zhuǎn)換概念使得在使用較低額定電壓的開關(guān)器件的同時,支持更高的輸入電壓。憑借多電平拓?fù)浣Y(jié)構(gòu)的頻率倍增效應(yīng),3-L FCTP PFC能夠帶來更高的效率和功率密度。最重要的是,CoolSiC?技術(shù)針對400 V的較低擊穿電壓進(jìn)行了優(yōu)化,與650 V 和 750 V CoolSiC?參考器件相比,其FoM更為優(yōu)異(見圖5(左))。此外,圖5(右)顯示了導(dǎo)通電阻在整個溫度范圍內(nèi)的曲線,其中,400 V CoolSiC? MOSFET的RDS(on) 100°C僅比RDS(on) 25°C高11%。RDS(on)與Tj之間的這一平緩關(guān)系有助于CoolSiC? MOSFET實(shí)現(xiàn)更高的RDS(on) typ,從而降低成本并提升開關(guān)性能。
圖4:第二代AI PSU的拓?fù)浣Y(jié)構(gòu)和器件技術(shù)示例
圖5:400 V CoolSiCTM與650 V和750 V CoolSiCTM對比,具有更優(yōu)的開關(guān) FoM和穩(wěn)定的RDS(on)與結(jié)溫的關(guān)系:品質(zhì)因數(shù)(左),RDS(on)與Tj(右)
對于DC-DC級來說,三相LLC拓?fù)浣Y(jié)構(gòu)是一種理想選擇,其中,750 V CoolSiC? MOSFET用于初級側(cè)開關(guān),80 V OptiMOS? 5 Power MOSFET用于次級全橋整流器和ORing。由于增加了第三個半橋開關(guān)臂,該解決方案能夠提供更高的功率,有效降低輸出電流的紋波,并通過三個開關(guān)半橋之間的固有耦合實(shí)現(xiàn)自動電流分配。
第三代AI PSU:三相架構(gòu)與400 V配電,最高功率約為22 kW,400 Vout,480-600 Vac,三相
為了進(jìn)一步提高機(jī)架功率,第三代AI PSU將采用更具顛覆性的機(jī)架架構(gòu),具體如下:
·PSU輸入:從單相轉(zhuǎn)為三相,以提高功率密度,并降低成本
·電源架PSU輸出電壓:從50 V提升到400 V,以降低母線電流、損耗和成本
圖6展示了一個三相輸入、400 V輸出的PSU部署示例,以及推薦的器件和技術(shù)。PFC級采用Vienna整流器,這是一種常用于三相PFC應(yīng)用的拓?fù)浣Y(jié)構(gòu)。其主要優(yōu)勢在于采用分離式總線電壓設(shè)計,因此可以使用650 V器件:通過使用雙倍數(shù)量的背靠背650 V CoolSiC? MOSFET和 1200 V CoolSiC?二極管實(shí)現(xiàn)。PFC輸出配置為分離式電容器,每個電容器電壓為430 V,并為全橋LLC轉(zhuǎn)換器供電,該轉(zhuǎn)換器在初級和次級側(cè)均使用650 V CoolGaN?晶體管。兩個LLC級在初級側(cè)串聯(lián),次級側(cè)并聯(lián),以向400 V母線供電。
此外,也可以將兩個背靠背的650 V CoolSiC? MOSFET替換為650 V CoolGaN? 雙向開關(guān)(BDS),后者是真正的常關(guān)型單片雙向開關(guān)。這意味著一個CoolGaNTM BDS即可取代4個分立式電源開關(guān),以實(shí)現(xiàn)相同的RDS(on),這是因?yàn)樗赗DS(on)/mm2方面具備更高的芯片尺寸利用率。
圖6:第三代AI PSU的拓?fù)浣Y(jié)構(gòu)和器件技術(shù)示例
WBG為 AI PSU帶來的優(yōu)勢
CoolGaN?助力實(shí)現(xiàn)高峰值功率瞬變
寬禁帶(WBG)半導(dǎo)體(例如,CoolGaN?[2])能夠在更高的開關(guān)頻率下,實(shí)現(xiàn)最佳效率,使轉(zhuǎn)換器在不影響轉(zhuǎn)換效率的前提下,實(shí)現(xiàn)更高的功率密度,因此,成為AI PSU的理想選擇。
除了AI PSU的額定功率顯著增加外,GPU在運(yùn)行時還會拉動更高的峰值功率,并產(chǎn)生高負(fù)載瞬變(見圖7)。因此,DC-DC級的輸出必須具有足夠的動態(tài)響應(yīng)能力,同時需確保電壓的過沖和下沖保持在規(guī)定的范圍內(nèi)。通過提升開關(guān)頻率,并增加控制環(huán)路帶寬,可以提高DC-DC級的輸出動態(tài)響應(yīng)能力。
圖7:AI GPU所需的AI PSU峰值功率
400 V CoolSiC? MOSFET可在3-L飛電容圖騰柱PFC中實(shí)現(xiàn)最高效率
使用 CoolSiC? MOSFET 400 V的三電平級飛跨電容圖騰柱PFC(3-L FCTP PFC)不僅能夠?qū)崿F(xiàn)更高的交流輸入電壓(見第2.2節(jié)),且相較CoolSiC? 650 V和750 V參考器件,其品質(zhì)因數(shù)(FoM)更佳,因此還能提供顯著的功率密度和效率優(yōu)勢。經(jīng)過優(yōu)化的電感器設(shè)計(包括尺寸、材料和繞組)和3L拓?fù)浣Y(jié)構(gòu)中的RDS(on)選擇,結(jié)合更低的開關(guān)損耗,能夠?qū)崿F(xiàn)平緩的效率曲線:峰值效率超過99.3%,滿載效率超過99.15%(見圖8)。
圖8:效率對比:3-L FCTP PFC與2-L TP PFC
結(jié)論
為了滿足數(shù)據(jù)中心對AI應(yīng)用的需求,新一輪技術(shù)角逐已經(jīng)啟動,推動了機(jī)架和PSU的電力需求大幅增長。其中,AI PSU的功率需求已經(jīng)從3-5.5 kW,提升到8-12 kW(單相)和高達(dá)22 kW(三相)。這種需求給數(shù)據(jù)中心運(yùn)營商帶來了新的挑戰(zhàn),即如何優(yōu)化數(shù)據(jù)中心的空間和電力的效率和利用率。應(yīng)對這些挑戰(zhàn)需要采用新的機(jī)架架構(gòu)和AC-DC配電配置,使得基于CoolSiC?和CoolGaN?的設(shè)計處于PSU設(shè)計的前沿,致力于實(shí)現(xiàn)最佳效率和功率密度。
此外,新的寬禁帶器件在新型拓?fù)浣Y(jié)構(gòu)中也展現(xiàn)了極佳的性價比,例如,在三電平飛跨電容圖騰柱PFC中采用400 V CoolSiC? MOSFET,或在三相Vienna PFC中使用650 V CoolGaN? BDS(詳見前文)。
總而言之,英飛凌的功率器件技術(shù)組合(硅、碳化硅和氮化鎵)和經(jīng)過優(yōu)化的柵極驅(qū) 動IC產(chǎn)品組合,通過混合應(yīng)用,為當(dāng)前和下一代平臺及趨勢的發(fā)展提供了支持。這些組合充分利用了三種技術(shù)的優(yōu)勢,使PSU設(shè)計實(shí)現(xiàn)了最佳靈活性,并在效率、功率密度和系統(tǒng)成本之間達(dá)成平衡。此外,英飛凌還率先推出了全球首項300毫米氮化鎵功率半導(dǎo)體等先進(jìn)技術(shù),進(jìn)一步推動了文章[10]中所述的未來設(shè)計發(fā)展。
參考文獻(xiàn)
[1]Infineon Technologies AG: We power AI, Online Media Briefing; https://www.infineon.com/dgdl/Online-Media-Briefing-We-Power-AI.pdf?fileId=8ac78c8b901005350190112f55a20002
[2]Infineon Technologies AG: Wide Bandgap Semiconductors (SiC/GaN); https://www.infineon.com/cms/en/product/technology/wide-bandgap-semiconductors-sic-gan/
[3]Infineon Technologies AG: GaN transistors (GaN HEMTs); https://www.infineon.com/gan
[4]Infineon Technologies AG: Silicon Carbide MOSFET Discretes; https://www.infineon.com/cms/en/product/power/mosfet/silicon-carbide/discretes/
[5]Infineon Technologies AG: Server and data center 3 kW 50 V PSU – Engineering report; https://www.infineon.com/dgdl/Infineon-Evaluation_board_EVAL_3KW_50V_PSU-ApplicationNotes-v01_00-EN.pdf?fileId=5546d46278d64ffd0178f986be9e08a7
[6]Infineon Technologies AG: 3300 W CCM bidirectional totem pole with 650 V CoolSiC? and XMC?– Infineon Technologies application note; https://www.infineon.com/dgdl/Infineon-Evaluationboard_EVAL_3K3W_TP_PFC_SIC-ApplicationNotes-v01_00-EN.pdf?fileId=5546d4626fc1ce0b016fc2ae66e20040
Infineon Technologies AG: 3.3 kW high-frequency and high-density PSU for server and datacenter applications; https://www.infineon.com/dgdl/Infineon-3.3_kW_high-frequency_and_high-density_PSU_for_server_and_datacenter_applications-ApplicationNotes-v01_00-EN.pdf?fileId=8ac78c8c90530b3a0190779314d375eb
[7]Infineon Technologies AG: CoolSiC? totem-pole PFC design guide and power loss modeling– Infineon Technologies application note; https://www.infineon.com/dgdl/Infineon-Application_note_CoolSiC_Totem_Pole_PFC_Design_and_Power_Loss_Modeling-ApplicationNotes-v01_00-EN.pdf?fileId=8ac78c8c85ecb34701865a064ec24076
[8]Infineon Technologies AG: CoolGaN? totem-pole PFC design guide and power loss modeling – Infineon Technologies application note; https://www.infineon.com/dgdl/Infineon-Design_guide_Gallium_Nitride-CoolGaN_totem-pole_PFC_power_loss_modeling-ApplicationNotes-v01_00-EN.pdf?fileId=5546d4626d82c047016d95daec4a769a
[9]Open Compute Project Foundation: ORv3-HPR standard; https://www.opencompute.org/wiki/Open_Rack/SpecsAndDesigns
[10]Infineon Technologies AG: Infineon pioneers world's first 300 mm power gallium nitride (GaN) technology – an industry game-changer; https://www.infineon.com/cms/en/about-infineon/press/press-releases/2024/INFXX202409-142.html
[11]Infineon Technologies AG: Powering AI PSU solutions;
https://www.infineon.com/cms/en/product/promopages/AI-PSU/
更多精彩內(nèi)容歡迎點(diǎn)擊==>>電子技術(shù)應(yīng)用-AET<<