算力正在進(jìn)入“基建化”的時(shí)代。
幾年前的時(shí)候,每當(dāng)電商大促、春晚紅包等節(jié)點(diǎn),宕機(jī)和救火幾乎是從不缺席的戲份。近兩年卻是另一番景象:即便是在618大促這樣的流量波峰,大多數(shù)電商平臺(tái)都頂住了高并發(fā)的壓力,背后離不開算力的迅猛增長。
正如中國信通院在一份研究報(bào)告中所揭示的:2016年到2020年期間,中國的算力規(guī)模平均每年增長42%,其中2020年的算力總規(guī)模已經(jīng)達(dá)到135EFlops,并仍在保持55%的高速增長。
只是算力高速增長的同時(shí),也帶來了新的問題。
一、數(shù)據(jù)中心能耗占比分析
對(duì)于不少人來說,“計(jì)算”早已不是什么新概念。每一次打開“綠碼”、每一次視頻會(huì)議、每一次搜索點(diǎn)擊……都離不開數(shù)據(jù)中心的處理計(jì)算?!坝?jì)算”在日常生活中的無縫滲透,勾勒出了多彩的數(shù)字世界。
可當(dāng)計(jì)算量越來越大,產(chǎn)生的功耗也隨之增大。以全球最為知名的預(yù)訓(xùn)練大模型GPT-3為例,一次訓(xùn)練要消耗巨量的算力,需要消耗約19萬度的電力,產(chǎn)生85萬噸的二氧化碳,將其形容為“耗電怪獸”絕不為過。
倘若這些電力用在了“計(jì)算”本身,或許不是什么壞消息。畢竟在數(shù)字經(jīng)濟(jì)的時(shí)代,有一個(gè)著名的經(jīng)濟(jì)學(xué)解釋,即算力上每投入一元,將帶動(dòng)3-4元的經(jīng)濟(jì)產(chǎn)出,“性價(jià)比”遠(yuǎn)高于傳統(tǒng)的農(nóng)牧業(yè)和工業(yè)生產(chǎn)。
現(xiàn)實(shí)的情況卻并不樂觀。根據(jù)開源證券研究所的統(tǒng)計(jì)結(jié)果,一個(gè)數(shù)據(jù)中心的能耗分布中,散熱系統(tǒng)的占比高達(dá)40%。也就是說,數(shù)據(jù)中心每耗費(fèi)一度電,只有一半用在了“計(jì)算”上,其他的則浪費(fèi)在了散熱、照明等方面。計(jì)算和散熱幾乎陷入了一場零和博弈,計(jì)算量越大散熱消耗的電量越大,如果不消耗足夠的能源提高散熱能力,將直接影響數(shù)據(jù)中心的性能、密度和可靠性。
行業(yè)內(nèi)也由此流行起了PUE的概念,即電源使用效率,用來測算數(shù)據(jù)中心消耗的所有能源與IT負(fù)載消耗的能源的比值,被視為評(píng)價(jià)數(shù)據(jù)中心能源效率的重要指標(biāo),PUE值越接近1,表明非IT設(shè)備的耗能越少,數(shù)據(jù)中心的能效水平越高。目前國內(nèi)大型數(shù)據(jù)中心的平均PUE值為1.55,超大型數(shù)據(jù)中心平均PUE值也只有1.46。
2020年時(shí)國內(nèi)數(shù)據(jù)中心的用電量已經(jīng)超過2000億千瓦時(shí),占到了用電總量的2.7%,預(yù)計(jì)2023年數(shù)據(jù)中心的能耗就將超過2500億千瓦時(shí),2030年時(shí)將超過4000億千瓦時(shí),用電量占比也將上升到3.7%。就這個(gè)角度而言,解決數(shù)據(jù)中心的能耗問題,已經(jīng)是擺在案前的棘手挑戰(zhàn)。
工信部在《新型數(shù)據(jù)中心發(fā)展三年行動(dòng)計(jì)劃(2021-2023年)》中,對(duì)數(shù)據(jù)中心的PUE進(jìn)行了明確規(guī)定:2021年底新建大型及以上數(shù)據(jù)中心的PUE降低到1.35以下,到2023年時(shí)要低于1.3。北京、深圳等城市也對(duì)新建數(shù)據(jù)中心提出了嚴(yán)格要求,其中深圳已經(jīng)發(fā)文鼓勵(lì)PUE值低于1.25的數(shù)據(jù)中心。
聯(lián)想到“碳達(dá)峰與碳中和”的時(shí)代背景,低PUE的“綠色計(jì)算”已經(jīng)是不爭的趨勢(shì)。淘汰掉高耗能的組件,升級(jí)算力高、空間節(jié)省、碳排放低的新組件,已經(jīng)是很多數(shù)據(jù)中心無法規(guī)避的現(xiàn)實(shí)問題。
在算力正在重塑產(chǎn)業(yè)格局的機(jī)遇面前,數(shù)據(jù)中心已然是無法拒絕的剛需,為數(shù)不多的選擇在于提高算力效率并降低能耗,而能否找到新的散熱方案,逐漸成為計(jì)算產(chǎn)業(yè)上下游必須應(yīng)對(duì)的課題。
傳統(tǒng)的散熱方案以風(fēng)冷為主,即將空氣作為冷媒,把服務(wù)器主板、CPU等散發(fā)出的熱量傳遞給散熱器模塊,再利用風(fēng)扇或空調(diào)制冷等方式將熱量吹走,也是散熱系統(tǒng)消耗數(shù)據(jù)中心近半電力的主要誘因。
當(dāng)PUE值被嚴(yán)格限定,綠色計(jì)算漸漸深入人心的時(shí)候,上世紀(jì)80年代就開始嘗試的“液冷”技術(shù),迅速成了產(chǎn)業(yè)上下游的新焦點(diǎn)。其實(shí)“液冷”技術(shù)的原理并不復(fù)雜,簡單來說就是利用礦物油、氟化液等絕緣低沸點(diǎn)的冷卻液作為冷媒,通過熱交換將服務(wù)器的熱量排出,并演變出了冷板式、噴淋式、浸沒式等多種散熱方案。
看似只是“冷媒”的改變,卻為數(shù)據(jù)中心的節(jié)能降耗帶來了諸多可能:
比如風(fēng)冷熱傳導(dǎo)存在過程復(fù)雜、熱阻總和大、換熱效率較低等痛點(diǎn),在很大程度上制約了數(shù)據(jù)中心的算力密度,并且常常會(huì)產(chǎn)生很大的噪聲。液冷技術(shù)所呈現(xiàn)出的節(jié)能降耗、減少噪聲、節(jié)約空間的特性,不可謂不誘人。
再比如風(fēng)冷想要提高散熱能力,最“簡單粗暴”的做法就是提高風(fēng)扇轉(zhuǎn)速,可把熱量帶出去的同時(shí),風(fēng)扇和硬盤間也會(huì)形成大的漩渦,不規(guī)則的湍流可能會(huì)影響硬盤的讀寫能力,甚至?xí)驗(yàn)榇蓬^震動(dòng)導(dǎo)致硬盤報(bào)廢。
液冷技術(shù)近乎完美地規(guī)避了這些不利因素,由于液冷方案是一個(gè)相對(duì)靜止的環(huán)境,可以有效降低由空氣、灰塵和震動(dòng)引起的硬件產(chǎn)品故障率,且數(shù)據(jù)中心始終在低溫環(huán)境中運(yùn)行,極大地提升了內(nèi)部電子元器件的使用壽命。
本文標(biāo)題:數(shù)據(jù)中心能耗占比分析:液冷散熱是數(shù)據(jù)中心節(jié)能減排最佳解決方案
本文鏈接:http://www.yangziriver.cn/faq3/168.html [版權(quán)聲明]除非特別標(biāo)注,否則均為本站原創(chuàng)文章,轉(zhuǎn)載時(shí)請(qǐng)以鏈接形式注明文章出處。