信息和正常運行時間變得越來越有價值,這提高了數(shù)據(jù)中心冗余的重要性。
停機的成本高昂,而且隨著時間的推移只會變得更加嚴(yán)重,因此組織必須盡一切努力防止意外停機。 數(shù)據(jù)中心冗余是實現(xiàn)這一目標(biāo)的最重要因素之一。
什么是數(shù)據(jù)中心冗余?
數(shù)據(jù)中心冗余是指使用重復(fù)的組件,以便在某些組件發(fā)生故障時保持運行不中斷,并在維護期間維持正常運行時間。 根據(jù) Uptime Institute 2022 年的一項研究,由于與電力相關(guān)的問題導(dǎo)致 43% 的數(shù)據(jù)中心重大停機,因此不間斷電源 (UPS) 和發(fā)電機是最常見的冗余目標(biāo)之一。 冷卻系統(tǒng)是另一個需要備份的常見組件,因為它們的故障可能會導(dǎo)致嚴(yán)重問題。
為什么數(shù)據(jù)中心冗余很重要
雖然數(shù)據(jù)中心冗余意味著在硬件上花費更多,但數(shù)據(jù)中心停機成本的上升證明了較高的前期費用是合理的。 Statista 在 2022 年的一項研究中發(fā)現(xiàn),2019 年,25% 的企業(yè)因單小時企業(yè)服務(wù)器停機而造成的損失在 301,000 美元至 400,000 美元之間。 對于許多組織來說,價格甚至更高,并且隨著數(shù)據(jù)訪問和云服務(wù)在業(yè)務(wù)中發(fā)揮核心作用,價格還將繼續(xù)攀升。
冗余可以最大限度地減少公司陷入高成本的可能性,幫助組織更快地從中斷中恢復(fù),并在發(fā)生中斷時保持基礎(chǔ)設(shè)施運行。 冗余還可以幫助組織確保滿足服務(wù)級別協(xié)議。
許多企業(yè)正在增加數(shù)據(jù)收集和分析,因為它可以改善決策、簡化運營等。 然而,這種趨勢使組織手頭掌握了大量敏感信息,一旦發(fā)生泄露,就會引發(fā)法律和道德問題。 冗余有助于確保數(shù)據(jù)技術(shù)在某些組件發(fā)生故障時正常工作,從而減少這些漏洞的機會。
數(shù)據(jù)中心冗余級別
數(shù)據(jù)中心冗余有不同的級別。 想要對其數(shù)據(jù)中心架構(gòu)做出最明智決策的企業(yè)必須了解這些級別及其含義。
冗余級別以 N 的概念為中心,這意味著滿負(fù)荷運行數(shù)據(jù)中心所需的最低基礎(chǔ)設(shè)施。 例如,如果數(shù)據(jù)中心需要四個 UPS 設(shè)備來運行,則 N 代表四個設(shè)備。 N 還適用于其他組件,例如冷卻系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)、存儲系統(tǒng)等。
最低級別的冗余是N+1,這意味著數(shù)據(jù)中心有一個額外的組件。 類似地,N+2 架構(gòu)為給定的 N 值提供兩個冗余組件。
N+1 是比 N+2 更常見的架構(gòu),因為它支持冗余并最大限度地降低硬件成本。 許多組織可能因為其成本效益而更喜歡 N+1,因為他們可以購買更少的硬件。
2N 代表 100% 冗余,其中數(shù)據(jù)中心對其所需組件具有相同的備份。 在數(shù)據(jù)中心中,N 是 UPS 單元的數(shù)量,2N 意味著擁有兩倍的數(shù)量。 有些架構(gòu)甚至更進一步,提供 2N+1,這相當(dāng)于完整的備份加上另一個組件。
數(shù)據(jù)中心層級
N 系統(tǒng)是衡量冗余的一種有用方法,但在實踐中,實現(xiàn)最大正常運行時間不僅僅是簡單地添加組件。 Uptime Institute 創(chuàng)建了一個分層系統(tǒng)來“解釋數(shù)據(jù)中心運營所需的基礎(chǔ)設(shè)施”。
主要有四個層次。
一級數(shù)據(jù)中心
一級數(shù)據(jù)中心是最基礎(chǔ)的。這些設(shè)施有足夠的冗余基礎(chǔ)設(shè)施來有效運行,但需要更多的冗余。它們可以承受人為錯誤造成的中斷,但不能承受意外中斷,必須關(guān)閉以進行維護。
二級數(shù)據(jù)中心
二級數(shù)據(jù)中心包括一些冷卻和電力系統(tǒng)冗余,提供更多的正常運行時間。員工可以在不關(guān)閉數(shù)據(jù)中心的情況下移除組件,但大型故障仍然會使數(shù)據(jù)中心離線。
三級數(shù)據(jù)中心
三級數(shù)據(jù)中心確保設(shè)施中每個組件的冗余。任何一點的故障都不會影響數(shù)據(jù)中心的運行。不需要停機來更換或維護設(shè)備。
四級數(shù)據(jù)中心
四級數(shù)據(jù)中心代表最大的正常運行時間。這些設(shè)施有幾個獨立和隔離的備份系統(tǒng),需要2N或2N+冗余級別。這些數(shù)據(jù)中心不太可能停機,盡管維護它們的成本很高。
選擇正確數(shù)據(jù)中心冗余級別的技巧
任何依賴數(shù)據(jù)中心運營的組織都需要冗余,但要求因情況而異。 確定業(yè)務(wù)需要什么級別,并考慮公司的 IT 預(yù)算。 請記住潛在停機的成本,因為它的成本可能很高。
IT 團隊還應(yīng)該考慮他們的風(fēng)險承受能力。 敏感數(shù)據(jù)很少或云環(huán)境不是關(guān)鍵任務(wù)的企業(yè)可以承受更大的風(fēng)險,因此 N+1 架構(gòu)可能就足夠了。 然而,如果組織更依賴云或處于監(jiān)管更嚴(yán)格的行業(yè),則可能需要更多冗余。
在這些決定中考慮法律要求和安全性。 某些法規(guī)可能需要更長的正常運行時間。 同樣,面臨更大網(wǎng)絡(luò)安全風(fēng)險的公司應(yīng)該尋求更高的冗余以減輕網(wǎng)絡(luò)攻擊。 無論組織級別如何,自動化監(jiān)控工具都可以加速事件響應(yīng),幫助防止停機。
本文標(biāo)題:數(shù)據(jù)中心冗余:基礎(chǔ)知識
本文鏈接:http://www.yangziriver.cn/faq3/867.html [版權(quán)聲明]除非特別標(biāo)注,否則均為本站原創(chuàng)文章,轉(zhuǎn)載時請以鏈接形式注明文章出處。