【導讀】高性能計算(HPC)的進步推動了計算密集型應用的創(chuàng)新,比如5G通信、航天發(fā)射、自動駕駛汽車等。與此同時,數(shù)據(jù)中心的能耗也在持續(xù)增加。
圖源:stock.adobe.com
數(shù)據(jù)中心
高性能計算(HPC)的進步推動了計算密集型應用的創(chuàng)新,比如5G通信、航天發(fā)射、自動駕駛汽車等。與此同時,數(shù)據(jù)中心的能耗也在持續(xù)增加。
這其中的大部分功率主要供給基礎CPU,以確保其能高效率的工作。例如,1U AMD Opteron或Intel Xeon服務器的功耗大約為300~400kW。一個機架上如果有24臺這樣的服務器,總功率將在7.2kW到9.6kW之間。而刀片服務器的部署更是加劇了這一問題。以Dell PowerEdge為例,42U機柜可容納60個刀片服務器(每個7U托盤有10個刀片服務器),每個托盤的功率總計達到驚人的5.066kW,每個機架合計30.4kW。
就數(shù)據(jù)中心而言,人工智能(AI)、機器學習和深度學習的加入使機架功率迅速飆升了兩倍,達到20千瓦范圍;超級計算機服務器機架現(xiàn)在接近100千瓦或更高。隨著計算環(huán)境越來越密集,數(shù)據(jù)中心的電源管理變得越來越重要。
為什么需要48V電源架構(gòu)?
當前,為數(shù)據(jù)中心提供電力的配電網(wǎng)(PDN)廣泛采用的是傳統(tǒng)的12V電源架構(gòu)。如今的AI加速模塊的功率水平早已超過750W,電流更是高達1,000A(在0.75V內(nèi)核電壓下)。當單個主板上有多達8個此類模塊時,其額定功率和熱管理工作將會十分驚人。在功率損耗和熱管理方面,通常有兩種方法可以改善PDN對電力系統(tǒng)性能的影響:
選項一
使用更大尺寸的電纜、連接器和更厚的主板電源板以降低PDN電阻;
選項二
提高PDN電壓以降低給定功率傳輸?shù)碾娏?,這樣可以降低電纜、連接器、主板銅平面尺寸及其相關(guān)的尺寸、成本和重量。
多年來,工程師們一直使用“選項一”來兼容幾十年來建立的單相交流和12V直流-直流(DC-DC)轉(zhuǎn)換器和調(diào)節(jié)器的大型生態(tài)系統(tǒng)。然而,將增加的功率分配給多個服務器處理會造成更大的功率損失,因此,近年來現(xiàn)代電力設計越來越多地開始使用“選項二”,即采用更高的PDN電壓來降低功率損耗。為此,谷歌在2016年的OCP峰會上提出了48V機架電源架構(gòu),用以取代當時普遍應用的12V。
相比12V電源架構(gòu),采用48V直流饋電的優(yōu)勢非常明顯。當48V直流電源被施加到每個計算主板電源的輸入端后,在傳輸12kW功率時,12V 1,000A此時就相當于48V 250A,流經(jīng)電源母線的電流僅為原來的1/4。從配電功率損耗(P=I2R)的角度來看,二者也有很大的差異。假設分配路徑的電阻為0.1mΩ,12V的分配損耗為100W,但在48V的情況下,損耗為6.25W,這里有16倍的差值。也就是說,相對12V的配電方案,48V方案可將總功率損耗降低16倍,整個系統(tǒng)的轉(zhuǎn)換效率提升30%。
圖1:12V和48V直流供電二者配電損耗比較
(圖源:Panasonic)
圖1比較形象地說明了12V和48V電源架構(gòu)的差異。從中我們可以看出,當每個機架的功率超過10kW時,傳統(tǒng)的12V DC饋電產(chǎn)生的功率分配損耗被認為達到了不可容忍的地步,而48V DC饋電的情況要好得多,非常有助于數(shù)據(jù)中心的功率節(jié)省。
數(shù)據(jù)中心電源產(chǎn)品的選擇
目前,正在運行的數(shù)據(jù)中心PDN很大一部分是針對從12V母線軌至Vcore的單級轉(zhuǎn)換進行設計和優(yōu)化的。采用全新的48V配電架構(gòu)雖然能顯著降低I2R帶來的損耗,但工程師的系統(tǒng)設計工作卻有著諸多挑戰(zhàn)。下面是幾個性能好,且簡單、易入手的設計方案和產(chǎn)品。
Vicor 48V電源架構(gòu)生態(tài)系統(tǒng)
隨著處理復雜AI功能的ASIC和GPU的出現(xiàn),處理器的功耗急劇增加。而電力傳輸和能效正在成為大規(guī)模計算系統(tǒng)中的核心關(guān)注點。為此,Vicor公司準備了系列化的產(chǎn)品組合,以實現(xiàn)交流或高壓配電和48V直接到負載轉(zhuǎn)換的高效解決方案,其中涉及的產(chǎn)品均具有高密度、高效率和高性價比,滿足大型計算系統(tǒng)中CPU、GPU或ASIC的功率需求。
針對前端解決方案,Vicor的母線轉(zhuǎn)換器模塊(BCM)可將HVDC轉(zhuǎn)換為隔離式SELV輸出,以此實現(xiàn)48V配電,并提供集成PMBus控制、EMI濾波和瞬態(tài)保護。在封裝上,BCM有ChiP或Vicor集成適配器(VIA)兩種規(guī)格,可簡化冷卻系統(tǒng)的設計。
現(xiàn)在,這個系列有73款BCM產(chǎn)品可供選擇,從800V擴展到48V輸入,具有各種K因數(shù)。以BCM6123TD1E5135T01為例,這是一款高效的母線轉(zhuǎn)換器,在260至410VDC的母線上運行,提供32.5至51.3VDC的隔離二次電壓。產(chǎn)品具有低噪聲、快速瞬態(tài)響應以及出色的效率和功率密度,同時頂部和底部的熱阻抗也非常低。
圖2:Vicor公司BCM6123高效母線轉(zhuǎn)換產(chǎn)品
(圖源:Vicor)
針對處理器供電方案,Vicor提出了“最后一英寸”供電方案,它采用的合封電源技術(shù)克服了為高功率處理器進行大電流傳輸造成的障礙,可提供更高的峰值以及超過1000A的平均電流,同時將主板銅箔連接電阻和處理器連接電阻銳減50倍。它還用分比式電源架構(gòu)(FPA)取代了傳統(tǒng)多相位穩(wěn)壓器,有效提高了電源功率密度和傳輸效率。
合封電源技術(shù)中的橫向供電(LPD)方案將模塊化電流倍增器(MCM)布置在基板上,不僅降低了PDN損耗,還能減少電源所需的處理器基板BGA引腳。在48V AI系統(tǒng)應用中,Vicor的LPD占據(jù)了很高的市場份額。對于有極高電流需求的處理器,Vicor的合封電源垂直供電(VPD)方案將MCM直接部署在處理器下方,相比LPD,PDN電阻還能再降10倍。
開放式計算項目(OCP)聯(lián)盟不僅為分布式48V服務器背板架構(gòu)帶來了開放式機架標準V2.2,還為AI開放式加速器模塊(OAM)帶來了48V標準工作電壓,這些標準要求48V至12V與12V至48V要能夠兼容。為了實現(xiàn)12V與48V的混合方案,Vicor準備了NBM2317雙向轉(zhuǎn)換解決方案,該轉(zhuǎn)換器可實現(xiàn)雙向的48V/12V高效轉(zhuǎn)換。
在降壓工作模式下使用K:1/4,而在升壓模式下則使用K:4/1,兩個方向均提供效率相同的處理能力。無論是將傳統(tǒng)板集成到48V基礎設施中,或?qū)⑿峦瞥龅腉PU集成到傳統(tǒng)12V機架中,都可以利用NBM2317輕松完成,增加了云數(shù)據(jù)中心提供商在方案部署上的靈活性。
圖3:48V/12V雙向轉(zhuǎn)換器NBM2317
(圖源:Vicor)
英飛凌48V供電IBC解決方案
在新興的48V電力轉(zhuǎn)換生態(tài)系統(tǒng)中,英飛凌為數(shù)據(jù)中心和AI應用提供了全套解決方案,并以較高的功率密度實現(xiàn)從48V到負載點的高效轉(zhuǎn)換。針對48V供電架構(gòu),英飛凌推出了全新的中間總線轉(zhuǎn)換器(IBC)解決方案,即所謂的混合開關(guān)電容(HSC)和零電壓開關(guān)型開關(guān)電容(ZSC)。
圖4:英飛凌48V中間總線轉(zhuǎn)換器解決方案
(圖源:英飛凌)
英飛凌方案中的HSC由6個MOSFET組成(Q1~Q6),分為兩條支路并通過兩個飛跨電容和一個稱為多抽頭自耦變壓器(MTA)的磁性器件連接。其中,MTA由4個繞組串聯(lián)而成,共用同一磁芯。借助其勵磁電感,零電壓開關(guān)(ZVS)操作得以實現(xiàn)高頻運行。
圖5:混合開關(guān)電容(HSC)內(nèi)部結(jié)構(gòu)
(圖源:英飛凌)
HSC具備較高的功率密度和效率,關(guān)鍵因素是采用了品質(zhì)因數(shù)出色的低額定電壓MOSFET。例如,在8:1配置中,電壓軌為48V的HSC可在Q3和Q6上使用額定電壓為25V的MOSFET。IQE006NE2LM5就是一款OptiMOS 25V低壓功率MOSFET,它采用PQFN3.3x3.3封裝,易于PCB布線,全新的源極底置封裝將當前標準RDS(on)降低了約30%。
圖6:采用PQFN3.3x3.3封裝的OptiMOS 25V低壓功率MOSFET(圖源:英飛凌)
針對ZSC拓撲,英飛凌推出了48V(或54V)輸入系統(tǒng)兩級架構(gòu),主要用于高性能處理器(CPU、GPU、SoC、ASIC等)供電。該架構(gòu)可在不影響性能的前提下,面向不同功率水平進行靈活實施和擴展。英飛凌專有的零電壓開關(guān)型ZSC通過功率器件的軟開關(guān)操作實現(xiàn)了電容式能量傳輸,顯著提高了48V至中間總線電壓的效率和功率密度。ZSC可輕松實現(xiàn)“向下兼容”或“模塊化”設計。ZSC的雙向能量傳輸能力為電源設計人員帶來了極高的靈活度,傳統(tǒng)的12V系統(tǒng)可以輕松、安全地過渡到48V設施。ZSC拓撲涉及的主要產(chǎn)品有:OptiMOS 5/6功率MOSFET、EiceDRIVER柵極驅(qū)動器以及XMC系列微控制器等。
本文小結(jié)
人工智能和云應用正在推動先進硬件的采用,包括微處理器、GPU、FPGA和需要更高功率級別的ASIC。包括英特爾的“Sky Lake”和AMD的“Rome”在內(nèi)的高級處理器在性能提升的同時,功耗也升至230-300W,英偉達的GPU功耗更將攀升到600W左右。
在數(shù)據(jù)中心的發(fā)展過程中,一個十分嚴峻的問題就是能耗的不斷增加。據(jù)統(tǒng)計,目前運營數(shù)據(jù)中心的能源已經(jīng)占到全球電力消耗的3%還多。僅以企業(yè)級數(shù)據(jù)中心為例,它每年消耗大約100兆瓦的電力,相當于大約8萬戶家庭的能源需求??梢哉f,電力成本已成數(shù)據(jù)中心主要的運營支出。因此,很大限度地提高電源效率是數(shù)據(jù)中心建設的當務之急。
OCP試圖通過定義電源架構(gòu)的新標準來應對此類挑戰(zhàn),具體步驟就是將中間總線電壓從傳統(tǒng)的12V提高至48V。這一舉措可顯著降低傳輸損耗,將電力更有效地傳輸?shù)接行ж撦d,比如AI ASIC/GPU/CPU或SOC上。當然,轉(zhuǎn)換效率只是決定數(shù)據(jù)中心電力使用方式的一個要素,其他有利于48V而不是12V的因素還包括,相同功率水平下電流消耗減少4倍,配電損耗降低16倍。這些進步意味著系統(tǒng)將擁有更好的熱性能,因此也同步降低了數(shù)據(jù)中心的冷卻要求,同時還有減少電源母線尺寸等好處。
2021年底的數(shù)據(jù)顯示,全球約有15%的數(shù)據(jù)中心已經(jīng)采用48V電源架構(gòu),其余數(shù)據(jù)中心仍繼續(xù)采用12V電源架構(gòu)。如今,這一轉(zhuǎn)變正在加速,據(jù)Advanced Energy估計,到本世紀中葉,多達50%的數(shù)據(jù)中心將采用48V電源架構(gòu)。
來自Market Watch的數(shù)據(jù),2022年,全球電力轉(zhuǎn)換市場規(guī)模約為292億美元,預計在預測期內(nèi)將以5.15%的復合年增長率增長,到2028年將達到395億美元左右。為了擁抱這一新趨勢,很多企業(yè)都推出了48V電力架構(gòu)生態(tài)系統(tǒng),市場上可選擇的產(chǎn)品很多,設計工程師也因此有了更多的選擇。
免責聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請聯(lián)系小編進行處理。
推薦閱讀:
EM-500儲能網(wǎng)關(guān)的AI采集性能實測
用于DC-DC轉(zhuǎn)換器的MIL-SPEC COTS EMC輸入濾波器