近年,伴隨著人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)技術(shù)的發(fā)展,高功率密度的超算設備成為服務器廠家紛紛布局的產(chǎn)品。目前高(功率)密度服務器中的單顆CPUTDP(ThermalDesignPower,散熱設計功耗)200W起步,例如intelXeon處理器;GPU、NPU、TPU等專業(yè)處理器的功耗更大,例如英偉達GPUTeslaV100的TDP達到300W。另一方面,由于高密度服務器內(nèi)集成的內(nèi)存數(shù)量、傳輸速率較之前都有數(shù)量級的提升,伴隨而來的內(nèi)存散熱問題也越來越得到重視。此外,SSD、I/O設備、VRD等設備功耗的增加也迫使服務器廠家不斷優(yōu)化散熱設計。
圖1某品牌高密度服務器
傳統(tǒng)服務器的散熱方式是強迫風冷,該方式的散熱能力取決于換熱系數(shù)、換熱面積及換熱溫差。通常的做法有:
1.給高功耗的處理器加裝散熱翅片,以增大風冷散熱面積;
2.配置變頻調(diào)速的大風量風機,優(yōu)化服務器內(nèi)的流場布局,一方面增大了換熱系數(shù),另外也通過大風量實現(xiàn)小溫差傳熱,把處理器的溫度控制在合理范圍內(nèi)。
強迫風冷散熱方式屬于氣體強制對流換熱方式范疇,因此該種散熱能力的理論上限為20-100W/(m2?????????K)。此外,由于高密度服務器的結(jié)構(gòu)緊湊,可供風道設計的尺寸減小,空氣側(cè)的流場阻力隨之增大,風機所能提供的風量由此減小。因此無論從理論上還是工程上,傳統(tǒng)強迫風冷的方式已逐漸無法滿足高密度服務器的散熱要求。
通過CPU強迫風冷傳熱熱阻與CPU散熱風扇轉(zhuǎn)速的關(guān)系曲線,可以使我們對風冷散熱方式的能力上限有一個更直觀的認識(見圖2)。
圖2服務器CPU散熱熱阻與風機轉(zhuǎn)速關(guān)系
在風機轉(zhuǎn)速從1000r/min提高到4000r/min的過程中,CPU散熱中對流占主導,空氣流速增加會使強制對流換熱系數(shù)顯著增加,即風機轉(zhuǎn)速的增加可以顯著的改善CPU的散熱性能;在風機轉(zhuǎn)速超過4000r/min后,傳熱熱阻下降比較平緩,因為此過程中對流換熱能力已經(jīng)逼近極限,風機轉(zhuǎn)速的增加只能改善與空氣的導熱傳熱,即此過程對CPU的散熱性能影響減弱了。
傳統(tǒng)風冷散熱方案已不能滿足高密度服務器的散熱要求,液冷散熱方式成為必然選擇。由于液態(tài)載冷劑的比熱容、換熱系數(shù)都遠高于空氣,因此更滿足高密度服務器的散熱要求。
通過幾種常見換熱方式的換熱能力對比(圖3),液相單相強制對流換熱能力比空氣強制對流高2個數(shù)量級,可滿足高能耗處理器的散熱要求。以XeonPlatinum8180芯片為例,芯片封裝后的尺寸是75mm×55mm,TDP是205W,如果采用空氣強制對流換熱方式,取換熱溫差40℃、對應最大熱流密度3W/cm2,則最大換熱能力為124W,不能滿足散熱要求。如采用液相單相強制對流換熱方式,取換熱溫差10℃、對應最大熱流密度為30W/cm2,則最大換熱能力是1240W,遠大于處理器的散熱要求,此外還可以實現(xiàn)更小換熱溫差的傳熱。
圖3幾種換熱形式熱流密度與換熱溫差的關(guān)系
處理器的電功耗主要分三部分:空載功耗、靜態(tài)功耗、動態(tài)功耗,其中靜態(tài)功耗與處理器的溫度息息相關(guān)。芯片溫度升高,處理器內(nèi)晶體管的泄漏電流增大,進而增大了處理器的靜態(tài)功耗。Zapater用指數(shù)形式擬合了靜態(tài)功耗Ps與處理器溫度的關(guān)系:
c2、c3——經(jīng)驗系數(shù)
Ps——處理器靜態(tài)功耗
Td——處理器壁面溫度
液冷方案中實現(xiàn)更小的溫差傳熱,使處理器壁面處于更低的溫度,進而減少了處理器的靜態(tài)功耗,即減小了散熱設備的負荷,同時還提高了IT設備的電能利用效率。
綜上所述,高密度服務器的散熱方式必然從傳統(tǒng)風冷向液冷轉(zhuǎn)變。
本文標題:淺析高密度服務器散熱的發(fā)展趨勢
本文鏈接:http://www.yangziriver.cn/faq3/83.html [版權(quán)聲明]除非特別標注,否則均為本站原創(chuàng)文章,轉(zhuǎn)載時請以鏈接形式注明文章出處。