數(shù)據(jù)中心已經(jīng)成為能源的重要消費(fèi)者。為了應(yīng)對(duì)數(shù)據(jù)中心及其服務(wù)器的激增,人們大力推動(dòng)降低所有數(shù)據(jù)中心組件的能耗。
經(jīng)過這么多努力,數(shù)據(jù)中心的電量真的會(huì)下降嗎?答案是否定的,盡管能源效率有了巨大的提高。
Arm基礎(chǔ)設(shè)施業(yè)務(wù)線產(chǎn)品解決方案副總裁Dermot O’Driscoll表示:“在21世紀(jì)20年代,保持?jǐn)?shù)據(jù)中心的能耗持平將比以往任何時(shí)候都更加困難?!??!耙恍╊A(yù)測(cè)表明,如果沒有實(shí)質(zhì)性的創(chuàng)新,數(shù)據(jù)中心的功耗可能會(huì)增長(zhǎng)2倍到7倍。”
在新基礎(chǔ)設(shè)施和全球總體發(fā)展的推動(dòng)下,工作量將大幅增加?!?a href="http://www.yangziriver.cn/tags/72.html">人工智能、5G和物聯(lián)網(wǎng)推動(dòng)了對(duì)數(shù)字服務(wù)的需求,與此同時(shí),新興經(jīng)濟(jì)體正在建設(shè)數(shù)字基礎(chǔ)設(shè)施,以幫助縮小數(shù)字鴻溝,”O(jiān)'Driscoll說。
預(yù)期的功率降低可能會(huì)使功率不會(huì)像在數(shù)據(jù)中心內(nèi)完成的工作那樣快速增加。這意味著更高效的處理,并且可以控制能耗。但它不太可能徹底降低能耗。這就提出了一個(gè)問題,即所需的額外能量從何而來,以及是否可以去碳化。
這一切都是在數(shù)據(jù)急劇增加的背景下發(fā)生的?!笆澜缟蟿?chuàng)建的數(shù)據(jù)有一半是在過去兩年中創(chuàng)建的,”Ansys電子和半導(dǎo)體業(yè)務(wù)部門主管Rich Goldman說。據(jù)推測(cè),我們正在收集所有這些數(shù)據(jù),以便對(duì)其進(jìn)行一些處理。
為了減少數(shù)據(jù)中心消耗的能源,人們付出了巨大的努力。這個(gè)拼圖有很多塊,它們都在引起注意。粗略地說,最顯著的影響因素包括服務(wù)器本身、數(shù)據(jù)中心內(nèi)部和之間的互連,以及防止過熱所需的冷卻。
每一部分的具體貢獻(xiàn)取決于所執(zhí)行的特定工作負(fù)載。機(jī)器學(xué)習(xí)訓(xùn)練和比特幣挖掘是能源密集型計(jì)算的兩個(gè)例子。
考慮到從長(zhǎng)遠(yuǎn)來看正在努力減少所有這些,人們可能會(huì)認(rèn)為數(shù)據(jù)中心能耗的持續(xù)增長(zhǎng)可能會(huì)被抑制,然后降低??偟膩碚f,這不太可能發(fā)生。
提高能源效率
所有的節(jié)能措施都有一個(gè)目的——在一定的能量下做更多的工作。這對(duì)于計(jì)算機(jī)來說是顯而易見的。只要單位能量所做的功增加,效率就會(huì)提高。
計(jì)算效率肯定提高了。挑戰(zhàn)在于,盡管我們現(xiàn)在可以用更少的能量做同樣的功,但要做的凈功卻在大幅增加。
但到目前為止,我們能夠?qū)崿F(xiàn)的效率提升非常有效。雖然有觀點(diǎn)認(rèn)為數(shù)據(jù)中心的能耗正在以指數(shù)級(jí)的速度增長(zhǎng),但情況可能并非如此。
“從2010年到2018年,數(shù)據(jù)中心的工作量增加了六倍多,”Cadence解決方案和生態(tài)系統(tǒng)高級(jí)集團(tuán)總監(jiān)Frank Schirmeister說?!盎ヂ?lián)網(wǎng)流量增加了10倍,存儲(chǔ)容量增加了25倍,而數(shù)據(jù)中心能耗變化不大,僅增長(zhǎng)了6%,達(dá)到205TWh。”
總體而言,全球約2%的能源流向數(shù)據(jù)中心。Synopsys的員工產(chǎn)品營(yíng)銷經(jīng)理Priyank Shukla說:“2020年,數(shù)據(jù)中心的總用電量約為300至440TWh”。“這可能會(huì)為整個(gè)伊朗國(guó)家提供電力,但不包括比特幣開采?!?/p>
Schirmeister表示,能源消耗需要結(jié)合實(shí)際情況來看待?!拔覀儗?shí)際上需要一個(gè)不同的指標(biāo)來定義我們所說的,因?yàn)橥ㄐ拧⒂?jì)算和存儲(chǔ)的增長(zhǎng)比能源消耗的增長(zhǎng)要快得多。”
今天使用的一個(gè)指標(biāo)是電力使用效率(PUE),這是一個(gè)總的衡量有多少能量流向開銷的指標(biāo)。它是用總能量除以計(jì)算量。理想值為1意味著根本沒有額外開銷。
“如今,數(shù)據(jù)中心的運(yùn)行效率為1.08到1.12 PUE,這意味著在進(jìn)行數(shù)據(jù)處理時(shí)消耗的總功率僅比總功率消耗少8%,”Shukla說。
確切地說,什么被排除在開銷之外有些模糊。它涵蓋的一個(gè)要素是進(jìn)入大樓的電線和流入服務(wù)器的電力之間的配電系統(tǒng)中的任何損失。
英飛凌的營(yíng)銷、電源管理、電源和傳感器解決方案業(yè)務(wù)部門主管Rakesh Renganathan說:“這對(duì)我們來說意味著,我們必須制造更高效的電源?!薄!叭匀挥幸恍﹦?chuàng)新可以讓更高效的電源更接近處理器?!?/p>
然而,隨著更多的電力輸送到每臺(tái)服務(wù)器,我們無法增加電力基礎(chǔ)設(shè)施的規(guī)模。Crocus系統(tǒng)和應(yīng)用工程副總裁Anuraag Mohan說:“數(shù)據(jù)中心的電源繼續(xù)推動(dòng)更高的功率密度,這意味著在相同的物理尺寸下有更多的功率。”。需要更高性能的傳感器來管理更高的密度,并確保更高效地使用能源。
冷卻和照明也包括在PUE開銷中,盡管冷卻部分僅包括整個(gè)建筑的冷卻,而不包括服務(wù)器風(fēng)扇。
互連
在衡量實(shí)際完成的工作時(shí),計(jì)算應(yīng)該占主導(dǎo)地位。其他一切都發(fā)生在計(jì)算服務(wù)中。其中一個(gè)主要的影響因素是移動(dòng)數(shù)據(jù)的成本。
Shukla說:“互連約占總功率的27%,處理約占20%?!?。
其他人則指出了類似的趨勢(shì)。Rambus的著名發(fā)明家、研究員Steven Woo說:“我們看到,在這個(gè)龐大的電力預(yù)算中,越來越多的數(shù)據(jù)被轉(zhuǎn)移到各地。”?!叭藗儾⒉豢偸窍氲降钠蠑?shù)據(jù)移動(dòng)也在消耗更多的能量?!?/p>
降低這種功耗的一種方法是使用具有更多端口的網(wǎng)絡(luò)交換機(jī),即所謂的高基數(shù)交換機(jī)。這允許在一個(gè)盒子內(nèi)進(jìn)行更多切換,減少了到達(dá)更遠(yuǎn)目的地所需的跳數(shù)。帶有256個(gè)端口的較新交換機(jī)應(yīng)該有助于實(shí)現(xiàn)這一點(diǎn)。
圖1:數(shù)據(jù)中心的網(wǎng)絡(luò)。通過增加交換機(jī)中的端口數(shù)量,可以在一個(gè)盒子中建立更多的連接,這意味著到后端的跳數(shù)更少。資料來源:Synopsys
有了所有這些聯(lián)系,SerDes的電力尤其增長(zhǎng)了很多倍。SERDE是兩種基本互連技術(shù)的一部分。首先,它們是PCIe的固有特性。承載PCIe流量的物理線路使用SerDes技術(shù),這方面可以從最新一代PCIe中受益。“如果您使用PCIe 6,業(yè)界預(yù)計(jì)您將節(jié)省30%的電量,”Shukla說。
使用可插拔模塊時(shí),光纖連接也需要SerDes技術(shù)。這些模塊插入服務(wù)器的外部,光信號(hào)在那里被轉(zhuǎn)換成電信號(hào),最終傳輸?shù)紺PU。電子“最后一只腳”使用SerDes技術(shù)。
降低互連功率的一種方法是從PCIe電氣互連轉(zhuǎn)移到更多的光學(xué)互連。雖然光纖是典型的長(zhǎng)途傳輸方式,在中距離(如數(shù)據(jù)中心之間或校園內(nèi))也在增長(zhǎng),但在相對(duì)較短的距離內(nèi),它尚未在建筑物中得到利用。
但在這樣做的同時(shí)節(jié)約能源可能需要更多的步驟。向相干調(diào)制的轉(zhuǎn)變可能會(huì)抵消由于需要額外的數(shù)字信號(hào)處理而節(jié)省的電能。雖然長(zhǎng)時(shí)間連接會(huì)斷電,但短時(shí)間連接是否會(huì)斷電尚不清楚。
此外,通過使用共同封裝的光纖將光纖一直傳輸?shù)椒?wù)器,消除了連接的SerDes分支,可以進(jìn)一步降低功耗。
冷卻
數(shù)據(jù)中心的另一個(gè)主要電力開銷是冷卻。出于記賬目的,冷卻似乎分為兩個(gè)部分。設(shè)施冷卻——例如,整體空調(diào)進(jìn)入PUE的非計(jì)算部分。但服務(wù)器在計(jì)算部分,它們有本地風(fēng)扇或其他冷卻基礎(chǔ)設(shè)施。
冷卻占了電力的很大一部分,但它是用于一些不起作用的東西。冷卻只是防止計(jì)算硬件燒壞。GRC的產(chǎn)品營(yíng)銷總監(jiān)Larry Kosch說:“數(shù)據(jù)中心所有用于冷卻的電力所占的比例可能會(huì)有所不同,但我認(rèn)為平均比例在40%到45%之間。”。
一般來說,冷卻分布更廣的電源比冷卻單個(gè)熾熱的芯片更容易?!霸诠β始性谝粋€(gè)很小的區(qū)域的200瓦芯片上冷卻是一回事,”Woo說。“如果你能以某種方式將這200瓦的功率分配到多個(gè)芯片上,那就另當(dāng)別論了。通過將其分配,從冷卻的角度來看,這會(huì)使問題變得更容易,因?yàn)楣β拭芏纫偷枚??!?/p>
目前有幾種減少冷卻的方法,其中一些涉及液體?!艾F(xiàn)在有更多的芯片使用液體冷卻,例如,他們有一個(gè)散熱器,它接觸到芯片,散熱器是空心的,”Woo 繼續(xù)說。“他們所做的是讓液體流過散熱器,然后吸走熱量?!边@需要機(jī)架內(nèi)的額外基礎(chǔ)設(shè)施來輸送和回收液體。
他補(bǔ)充道:“人們對(duì)所謂的浸入式冷卻也更感興趣,在這種冷卻中,你可以直接將電子板浸入電惰性流體中?!薄?/p>
液體可以更有效地轉(zhuǎn)移熱量。Kosch說:“浸入式計(jì)算每個(gè)機(jī)架的密度(每個(gè)機(jī)架100+千瓦)很容易超過風(fēng)冷機(jī)架(每個(gè)機(jī)架約15千瓦),因?yàn)樗軌蛞愿咝屎妥钚』驘o水損失的方式冷卻信息技術(shù)設(shè)備(ITE)。”。
一種浸入法被稱為單相浸入法,完全依賴于冷卻劑的液態(tài)階段。冷卻液循環(huán)以促進(jìn)冷卻。
另一種方法被稱為兩相浸入法,之所以這樣命名是因?yàn)槔鋮s發(fā)生在冷卻劑的液態(tài)階段和汽態(tài)階段。服務(wù)器浸沒在液體中,但液體在芯片表面沸騰,上升的蒸汽作為傳熱機(jī)制。據(jù)稱,自然對(duì)流過程可以減少對(duì)泵和其他基礎(chǔ)設(shè)施的需求。
用液體包圍電子設(shè)備是不直觀的,但如果液體是絕緣體,就不會(huì)發(fā)生短路。如果化學(xué)成分正確,則不應(yīng)出現(xiàn)腐蝕或降解。
Kosch說:“雖然可以浸入設(shè)計(jì)為風(fēng)冷的ITE(只需關(guān)閉風(fēng)扇、調(diào)整固件等微小修改),但快速增長(zhǎng)的采用率已經(jīng)產(chǎn)生了足夠的需求,因?yàn)镮TE原始設(shè)備制造商已經(jīng)將浸入式服務(wù)器推向了市場(chǎng)。”。“眾所周知,微軟采用了兩相浸入式冷卻,而亞馬遜則依賴于直接到芯片的冷卻。單相浸入式冷卻在這個(gè)市場(chǎng)上有一席之地?!?/p>
圖2:?jiǎn)蜗嘟胧嚼鋮s機(jī)架。刀片服務(wù)器垂直插入電介質(zhì)中。這里展示的是移動(dòng)數(shù)據(jù)中心機(jī)架。資料來源:GRC
更平淡無奇的是,在優(yōu)化冷卻時(shí),位置也很重要。Facebook在俄勒岡州的普里內(nèi)維爾設(shè)立了一個(gè)數(shù)據(jù)中心,部分原因是氣候較冷?!八鼈兛梢酝ㄟ^管道進(jìn)入溫度較低的室外空氣,這使它們更容易冷卻,因?yàn)樗鼈儾恍枰獙?duì)空氣進(jìn)行太多冷卻,”Woo說。
在極端情況下,微軟有一個(gè)名為Natick的演示項(xiàng)目,在該項(xiàng)目中,服務(wù)器被放置在一個(gè)密封的容器中,該容器被淹沒在海洋中兩年?!八麄儗⒁粋€(gè)小型數(shù)據(jù)中心淹沒在海洋中,以獲得一個(gè)非常好的熱控制環(huán)境,”Woo解釋說?!澳阒車呛銣氐乃?,它有巨大的吸熱能力?!?/p>
服務(wù)器不僅存活了下來,而且更有效的冷卻帶來了更高的可靠性——相當(dāng)于陸地服務(wù)器故障率的八分之一。
更高效的計(jì)算
雖然這些努力的部分目標(biāo)是將更大份額的能源用于實(shí)際計(jì)算,但這并不是真正的結(jié)局。真正的目標(biāo)是做更多的工作,這不僅需要更多的計(jì)算能量,還需要更高效的計(jì)算。
這種情況可能會(huì)發(fā)生,但有三個(gè)更大規(guī)模的改進(jìn)將產(chǎn)生更大的影響。
一個(gè)是發(fā)明新的CPU體系結(jié)構(gòu)的能力,這種體系結(jié)構(gòu)本質(zhì)上更高效。這不僅僅是低功耗電路設(shè)計(jì),而是重新思考如何進(jìn)行計(jì)算,以及如何在計(jì)算執(zhí)行時(shí)減少數(shù)據(jù)移動(dòng)的頻率。
“現(xiàn)在出現(xiàn)了新的處理器架構(gòu),可以節(jié)省處理能力,”Shukla說。
特別是機(jī)器學(xué)習(xí)正在迅速成為一個(gè)巨大的能源用戶。但是機(jī)器學(xué)習(xí)有兩個(gè)方面。最常見的是推理——使用已知的算法來解決問題。但這可以非常有效地完成——如此之多,以至于在某些應(yīng)用中,即使在微瓦級(jí)也可以在邊緣完成。
模擬電路正在利用諸如內(nèi)存計(jì)算之類的想法來幫助其中一些架構(gòu)?!俺朔ê屠奂涌梢栽谀M中完成,”Shukla說,他暗指存儲(chǔ)器可以用于模擬計(jì)算的方式。
真正的機(jī)器學(xué)習(xí)能源消耗是培訓(xùn),而這幾乎完全是在數(shù)據(jù)中心完成的。在訓(xùn)練新的機(jī)器學(xué)習(xí)模型時(shí),需要繼續(xù)努力降低能耗。
最后,在更遠(yuǎn)的未來,光子計(jì)算有希望。光子“電路”進(jìn)行的計(jì)算名義上是無損的。所消耗的能量主要用于產(chǎn)生激光。光發(fā)生的變化可以用很少的能源成本來管理。
“Lightmatter聲稱功率降低了30倍,”Shukla說。該公司正在開發(fā)光子計(jì)算。
再加上光子學(xué)體系結(jié)構(gòu)可能發(fā)生的變化,以及互連中光子學(xué)的使用增加,這也有助于降低單位計(jì)算工作量的能耗。
實(shí)際能源限制
雖然很容易描繪出能源使用量無休止增長(zhǎng)的畫面,但對(duì)于給定的數(shù)據(jù)中心來說,這種增長(zhǎng)是有實(shí)際限制的。
一個(gè)方面是監(jiān)管。當(dāng)新的數(shù)據(jù)中心被允許時(shí),它將從電網(wǎng)中獲得一定數(shù)量的能源——根據(jù)可用于滿足數(shù)據(jù)中心和市政當(dāng)局其他需求的能源。
“你愿意建立數(shù)據(jù)中心的城市或地方顯然讓數(shù)據(jù)中心變得越來越大,”Woo說?!暗潜仨氂幸恍┫拗?,而這個(gè)限制將由你將要建立數(shù)據(jù)中心的地方的政府設(shè)定?!?/p>
另一個(gè)限制是建筑施工時(shí)內(nèi)置的容量。具有前瞻性思維的建筑師將始終為增長(zhǎng)做好準(zhǔn)備——即使預(yù)計(jì)允許的能源使用量可能會(huì)增加。但一旦這座建筑完工,增加配電能力可能不是一件小事。
這在一定程度上限制了現(xiàn)有數(shù)據(jù)中心所能消耗的能量。因此,更大的增長(zhǎng)不是來自使用更多能源的建筑,而是來自新數(shù)據(jù)中心的建設(shè)。
能源
雖然近來我們的能源消耗越來越大,但事實(shí)仍然是數(shù)據(jù)中心的電力仍在增長(zhǎng)——只是速度更為緩慢??紤]到未來十年預(yù)計(jì)會(huì)有大量額外的數(shù)據(jù)處理,沒有人相信凈能耗會(huì)下降。
隨著越來越多的設(shè)備連接到互聯(lián)網(wǎng)——尤其是電動(dòng)汽車和自動(dòng)駕駛汽車的連接——數(shù)據(jù)傳輸預(yù)計(jì)將大幅增長(zhǎng)。至少,這意味著需要移動(dòng)和存儲(chǔ)所有這些數(shù)據(jù)。
但如果這些數(shù)據(jù)不經(jīng)過計(jì)算,就沒有價(jià)值。分析和其他操作,其中許多涉及機(jī)器學(xué)習(xí),將有更多的數(shù)據(jù)可供操作。這意味著需要完成的工作總量將大幅增長(zhǎng),可能超過效率的提高。
這種能量從哪里來?有兩個(gè)挑戰(zhàn)。首先是產(chǎn)生更多能源的能力——最好是在數(shù)據(jù)中心附近。但是,在我們也在努力減少能源生產(chǎn)的碳化、依賴可再生能源并擺脫化石燃料的時(shí)候,這是必要的。
這是一個(gè)更大的挑戰(zhàn)。我們究竟如何實(shí)現(xiàn)這一目標(biāo)尚不清楚。盡管數(shù)據(jù)中心在全球用電量中所占的份額仍低于10%,但這是一個(gè)顯而易見的部分??梢哉f,與其他許多可能確實(shí)降低凈能耗的部門不同,它將繼續(xù)增長(zhǎng)的事實(shí)意味著它在總能耗中的份額將增長(zhǎng)得更快。
“人們已經(jīng)準(zhǔn)備好做一些事情,比如把他們的數(shù)據(jù)中心放在靠近水力和可再生能源的地方,在那里他們可以從附近的東西獲得大量能源,”Goldman說。
隨著越來越多的人關(guān)注數(shù)據(jù)中心的這一方面,新的解決方案可能會(huì)出現(xiàn)。“關(guān)于如何去碳化,我有明確的道路嗎?”Schirrmeister問道。“還沒有,但聰明的工程師會(huì)解決這個(gè)問題?!?/p>
結(jié)論
歸根結(jié)底,要做的工作太多了,以至于沒有跡象表明在可預(yù)見的未來任何時(shí)候能源消耗都會(huì)下降。我們可能會(huì)找到更友好的能量來源,但胃口不會(huì)輕易平息。
如果要在降低總體能耗和加大能耗之間做出選擇,選擇將是顯而易見的。芯片設(shè)計(jì)師每天都會(huì)做出同樣的選擇?!皩?duì)于每一個(gè)新的過程,我們都有一個(gè)選擇——讓它更強(qiáng)大,或者降低相同功能的功率,”Goldman說。“我們從不追求降低功耗。我們追求更強(qiáng)大的功能。在數(shù)據(jù)中心,我們看到了類似的東西。”
Woo總結(jié)了半導(dǎo)體開發(fā)人員的底線:“對(duì)于像我們這樣的半導(dǎo)體行業(yè)的人來說,可行的項(xiàng)目是讓個(gè)人計(jì)算更節(jié)能——不管怎樣?!比缓?,數(shù)據(jù)中心設(shè)計(jì)師將盡可能多地使用它。
本文標(biāo)題:為什么數(shù)據(jù)中心的能耗永遠(yuǎn)不會(huì)下降
本文鏈接:http://www.yangziriver.cn/faq3/654.html [版權(quán)聲明]除非特別標(biāo)注,否則均為本站原創(chuàng)文章,轉(zhuǎn)載時(shí)請(qǐng)以鏈接形式注明文章出處。