一、智能時代,數(shù)據(jù)中心基礎設施的新需求
隨著各行各業(yè)數(shù)字化變革的不斷深入,人類社會正加速邁向智能化。作為智能世界和數(shù)字經(jīng)濟的堅實底座,數(shù)據(jù)中心也迎來了蓬勃發(fā)展。面對ICT技術快速演進、建設需求激增以及綠色低碳要求,對數(shù)據(jù)中心基礎設施的建設也提出了更高要求,具體表現(xiàn)在以下幾個方面:
1.安全可靠,數(shù)據(jù)中心的核心需求
2022年-2023年期間,香港、新加坡、澳大利亞等地發(fā)生過大規(guī)模數(shù)據(jù)中心因基礎設施故障導致的宕機事件,引起了業(yè)界高度關注。事實上,隨著數(shù)字化的發(fā)展,整個社會的運轉(zhuǎn)對數(shù)據(jù)的依賴程度越來越高,IT服務一旦中斷,就會給生產(chǎn)生活帶來不便,造成巨大經(jīng)濟損失,嚴重影響企業(yè)的聲譽。盡管數(shù)據(jù)中心IT設施的虛擬化能力、業(yè)務遷移能力逐漸提升,但數(shù)據(jù)中心對基礎設施安全可靠的要求并沒有絲毫放松。隨著政治產(chǎn)業(yè)環(huán)境日益復雜,引發(fā)事故的風險種類發(fā)生了一些變化,但安全可靠始終是數(shù)據(jù)中心最核心的需求,針對新興的風險因素,要做好防范策略。
2.高效節(jié)能,雙碳背景下的新目標
碳中和是全球的共識和使命,綠色低碳已經(jīng)成為世界新的主題。隨著數(shù)字化、智能化的發(fā)展,數(shù)據(jù)中心的規(guī)模在不斷擴大,用于支持數(shù)據(jù)中心運行的能耗也在快速增加。世界各國各地紛紛出臺各種政策或指導意見,牽引數(shù)據(jù)中心走向高效節(jié)能,綠色低碳。過去,大多數(shù)企業(yè)僅從經(jīng)濟效益來評判節(jié)能措施?,F(xiàn)在,節(jié)能已經(jīng)成為是否合規(guī)的重要考核指標,直接代表了企業(yè)的社會責任和形象。
3.經(jīng)濟適用,確保投資效益最大化
在數(shù)據(jù)中心建設規(guī)模較小的年代,數(shù)據(jù)中心在企業(yè)總資產(chǎn)中占比不高,企業(yè)對數(shù)據(jù)中心投資的經(jīng)濟性不是特別敏感。隨著數(shù)字化的發(fā)展,數(shù)據(jù)中心建設的規(guī)模在增加,投資額急劇增加,其投資的經(jīng)濟性變得越來越重要。在數(shù)據(jù)中心建設過程中,既需要考慮整體TCO,還需要考慮分期部署和快速建設,力爭快速形成收入,嚴格控制折舊等營運成本,確保投資效益的最大化。
4.智能運維,達成規(guī)劃指標的最強助力
智能化是數(shù)據(jù)中心發(fā)展的必然趨勢,只有智能化才能讓操作更及時、更準確、更可靠、更經(jīng)濟,全面提升運行效率,確保達成規(guī)劃指標。智能化還能減少人的干預,減少誤操作,提升可靠性。此外,AI技術在智能化領域的應用,能夠幫助數(shù)據(jù)中心進一步調(diào)優(yōu),提升運營效率。
二、創(chuàng)新的數(shù)據(jù)中心供電制冷解決方案
針對數(shù)據(jù)中心的這些發(fā)展和變化,以供電和制冷為主的數(shù)據(jù)中心關鍵設施的解決方案,也有了新的創(chuàng)新。
1.電力模塊成為數(shù)據(jù)中心供配電首選解決方案
電力模塊由變壓器、進線母聯(lián)柜、SVG柜、UPS、維修旁路柜、饋線柜組成,通過柜頂工廠預制銅排連接。電力模塊內(nèi)部集成一體化監(jiān)控系統(tǒng),可進行參數(shù)設置并實時監(jiān)測設備狀態(tài)、參數(shù)等。電力模塊設備如圖1所示。
傳統(tǒng)供配電系統(tǒng)設備來源多個供應商,設備間的連接銅排需要設備就位后測量、訂貨,銅排、線纜均需要現(xiàn)場制作安裝,包括整體聯(lián)調(diào)、系統(tǒng)驗證,整個周期大于2個月。電力模塊具有融合高密、部件模塊化、工程產(chǎn)品化、產(chǎn)品預制化等特點,采用工廠組裝預制化,標準流水化作業(yè),出廠測試,安裝施工環(huán)節(jié)引入外部風險小,相比傳統(tǒng)方案單套交付時間控制在2周以內(nèi),品質(zhì)可控,運行可靠性更高。電力模塊方案采用了高密高效的UPS,并輔以配電柜結(jié)構(gòu)優(yōu)化設計,減小整體尺寸,通常能夠節(jié)約20-40%以上面積,提升機房IT機柜的出柜率2-5%。全鏈路效率提升1-3%。電力模塊內(nèi)部功率模塊、旁路模塊、SVG模塊、開關模塊等易損部件均采用模塊化熱插拔設計理念,當系統(tǒng)出現(xiàn)故障后可以在線維護,時間僅需要5min,大大的提高了系統(tǒng)可用性。
華為推出的超融合電力模塊解決方案,除具備上述電力模塊所有優(yōu)點外,在UPS架構(gòu)、結(jié)構(gòu)以及系統(tǒng)AI特性兩方面進一步投入。超融合UPS內(nèi)部架構(gòu)融合UPS輸入、輸出開關和UPS主機,采用隔離開關+熔斷器實現(xiàn)電源轉(zhuǎn)換、電氣隔離和保護功能,從而大大減小了整體占地面積,節(jié)約占地面積在40%以上。另外,超融合UPS模塊化程度更高,整機內(nèi)除隔離開關外其余部件均可以實現(xiàn)在線維護,做到真正的維護不斷電。電氣故障是影響全球數(shù)據(jù)中心安全運行的主要原因,華為電力模塊具備獨有的AI診斷功能,對部件使用壽命進行預測,提前發(fā)出告警,防患于未然,避免部件故障影響系統(tǒng)運行。
總之,較傳統(tǒng)供配電產(chǎn)品和解決方案,電力模塊節(jié)地、節(jié)能、省時、省力,可以提升數(shù)據(jù)中心建設過程的靈活性和使用過程的可靠性,因此,已經(jīng)被廣大數(shù)據(jù)中心從業(yè)者普遍接受并廣泛應用。
2.以間接蒸發(fā)冷卻空調(diào)系統(tǒng)為首的分布式制冷越來越普及
近兩三年內(nèi),華為、騰訊、快手、萬國、秦淮、中行、農(nóng)行等涉及互聯(lián)網(wǎng)、金融、政府多個行業(yè)的新建或待建的數(shù)據(jù)中心,更多采用了間接蒸發(fā)冷卻的空調(diào)方案。海外眾多數(shù)據(jù)中心運營商在最近幾年的建設中,也在減少冷凍水方案的應用,取而代之的則是間接蒸發(fā)冷卻空調(diào)方案。
所謂間接蒸發(fā)冷卻空調(diào)系統(tǒng)(AHU),就是將新風蒸發(fā)冷卻后得到的濕空氣的冷量,通過非直接接觸式換熱器傳遞給機房的熱回風,再輔以必要的過濾、補冷等措施,為機房提供滿足要求的冷卻送風。整個過程只有冷量的傳遞,沒有物質(zhì)的交換。間接蒸發(fā)冷卻機組的內(nèi)部結(jié)構(gòu)如圖2所示。
間接蒸發(fā)冷卻空調(diào)系統(tǒng)可以實現(xiàn)冷源與負荷中心近距離接觸,利用逼近濕球溫度的風側(cè)自然冷卻,實現(xiàn)全年應用自然冷卻。即使最炎熱的夏季,也只需要50%左右的機械制冷作為補冷,因此可以顯著減少數(shù)據(jù)中心空調(diào)系統(tǒng)能耗。
除了節(jié)能,間接蒸發(fā)冷卻空調(diào)系統(tǒng)還擁有很多傳統(tǒng)冷凍水不具備的優(yōu)點,AHU屬于分布式架構(gòu)的標準化產(chǎn)品,設計、施工、運維相對簡單,故障率低,運行效果與設計偏差小。AHU故障定位相對容易,設備運行相對獨立,互相之間無關聯(lián),故障影響面小。AHU建設施工周期短,調(diào)試時間短,改擴建不會影響已運行的模塊,有利于分期投資。AHU無論是初投資,還是運行費用都低于傳統(tǒng)冷凍水。該設施還可以輔以AI,進行自動調(diào)優(yōu)運行。
華為最近推出的EHU設備,除了具備AHU的全部優(yōu)點之外,還對其電氣系統(tǒng)做了深度的優(yōu)化,其供電架構(gòu)如圖3所示。
新型的EHU,電源側(cè)無需配備UPS主機,主備路電源切換過程可以通過電池供電,實現(xiàn)制冷無中斷,機房溫度零波動。電池供電負載可以通過控制軟件靈活調(diào)整,自由選擇風機、壓縮機、水泵分別或組合由電池供電。只要電池容量配置得當,未來還可根據(jù)需要調(diào)整,大大提升靈活性。機組內(nèi)置諧波治理裝置,THDi<5%;具備校正功率因數(shù)功能,輸入功率因數(shù)低至0.99,減小輸入開關和輸入電纜規(guī)格,提升項目的經(jīng)濟性。
總之,自然冷卻利用率更高,系統(tǒng)更節(jié)能,分布式架構(gòu)更可靠,TCO更優(yōu),運維管理更簡單、更智能,這些優(yōu)勢完全匹配了數(shù)據(jù)中心的發(fā)展趨勢,這是近年來數(shù)據(jù)中心普遍采用這種制冷方式的原因。
三、智能時代,數(shù)據(jù)中心建設面臨的新挑戰(zhàn)
數(shù)據(jù)中心可靠性的標準包括“數(shù)據(jù)中心設計規(guī)范(GB0174)”,“Telecommunications infrastructure standard for datacenters(ANSI/TIA-942-B)等,對數(shù)據(jù)中心的級別和冗余能力進行了細致規(guī)范,可以防范的故障種類主要包括地震、洪澇等環(huán)境災害,市政停電停水、產(chǎn)品或系統(tǒng)正常運行中的故障等,基本沒有針對惡意因素導致的故障。隨著政治經(jīng)濟形式的變化,引發(fā)數(shù)據(jù)中心故障的原因也有所變化,比如網(wǎng)絡安全和供應鏈安全。
1.網(wǎng)絡安全已經(jīng)成為數(shù)據(jù)中心的潛在風險
網(wǎng)絡攻擊具備檢測難、防護難、恢復難的特點,對數(shù)據(jù)中心的危害極大。過去,因為發(fā)生概率低,很多數(shù)據(jù)中心并沒有制定對應的防范措施。當前,數(shù)據(jù)中心的基礎設施系統(tǒng)已經(jīng)演進為復雜的智慧生命體,智能化這把雙刃劍,在提升可靠性和效率的同時,也帶來了網(wǎng)絡安全的威脅,對于數(shù)據(jù)中心,其設備端、通信網(wǎng)絡端、管理平臺端都存在被攻擊的可能性,不論是IT設施,還是機電設施,受到攻擊,都會影響數(shù)據(jù)中心上層業(yè)務的連續(xù)性。我們需要在數(shù)據(jù)中心基礎設施領域引入更多的網(wǎng)絡安全相關的標準、認證,適時制定針對數(shù)據(jù)中心基礎設施的網(wǎng)絡安全標準,建設以網(wǎng)絡安全為底線的軟硬件一體化的防御體系,對抗網(wǎng)絡攻擊和威脅。
2.供應鏈安全正成為數(shù)據(jù)中心關注的新焦點
習近平總書記在黨的二十大報告中指出,“著力提升產(chǎn)業(yè)鏈供應鏈韌性和安全水平”。供應鏈的韌性和安全水平反映企業(yè)抵抗風險能力的大小,對企業(yè)經(jīng)濟體系運行具有重要影響。針對產(chǎn)品的研發(fā)、采購、生產(chǎn)、供應,企業(yè)有必要采用多元化方案,避免獨家供應或單一地區(qū)供應帶來的風險,保障產(chǎn)品的可供應性。制造能力和運輸能力也需要備份,確保突發(fā)事件下可啟用備份運輸路線,保障物流運輸業(yè)務的連續(xù)性。
近十年來,華為成功應對了許多重大自然災害、政治、經(jīng)濟、貿(mào)易、網(wǎng)絡病毒災害等風險事件,充分表明華為建立的供應連續(xù)性管理體系和管理機制是完全有效的,能夠保障供應連續(xù)性和產(chǎn)品以及客戶服務的及時交付。
四、結(jié)束語
對于數(shù)據(jù)中心來說,安全可靠是發(fā)展的前提,綠色低碳是可持續(xù)發(fā)展的保證,相信同行會一起努力、一起踐行,確保智能時代數(shù)據(jù)中心的高質(zhì)量建設,高效率運營。
來源:網(wǎng)絡
本文標題:智能時代 數(shù)據(jù)中心建設的新思考
本文鏈接:http://www.yangziriver.cn/faq3/1075.html [版權聲明]除非特別標注,否則均為本站原創(chuàng)文章,轉(zhuǎn)載時請以鏈接形式注明文章出處。