如今,人工智能/機(jī)器學(xué)習(xí)、金融應(yīng)用和邊緣計(jì)算架構(gòu)等萬(wàn)億級(jí)應(yīng)用無(wú)處不在,而且不僅僅存在于大型組織中。這些應(yīng)用將數(shù)據(jù)量推向前所未有的水平,因此需要大量存儲(chǔ),以及一個(gè)如何在不消耗整體IT預(yù)算情況下持續(xù)確保性能的計(jì)劃。
許多IT領(lǐng)導(dǎo)者認(rèn)為,對(duì)他們來(lái)說(shuō)最具成本效益的存儲(chǔ)選擇是固態(tài)盤(SSD),而不是硬盤驅(qū)動(dòng)器(HDD)。
但這真的如此嗎?正如數(shù)據(jù)中心運(yùn)營(yíng)商所知,電力、冷卻/加熱、房產(chǎn)和其他總體擁有成本(TCO)方面的考慮因素超出了那些必須考慮到的前期軟件和存儲(chǔ)介質(zhì)等成本。
來(lái)自各種驅(qū)動(dòng)器和存儲(chǔ)設(shè)備廠商和、分析師和顧問(wèn)的分析表明,即使受到QLC閃存技術(shù)和存儲(chǔ)密度改進(jìn)等創(chuàng)新成果的推動(dòng),SSD并不總是具有優(yōu)勢(shì)的。
讓我們看看以下這三類應(yīng)用以及針對(duì)每一類型應(yīng)用使用硬盤驅(qū)動(dòng)器和固態(tài)盤的注意事項(xiàng)。
應(yīng)用1:延遲敏感分析
閃存最適合以下情況:
閃存固態(tài)盤通常特別適合于那些需要隨機(jī)訪問(wèn)小數(shù)據(jù)負(fù)載的應(yīng)用。例如,在執(zhí)行鏈中的下一步之前,對(duì)產(chǎn)品訂購(gòu)系統(tǒng)進(jìn)行任意查詢并使用密鑰(例如客戶姓名或電話號(hào)碼)查找客戶記錄的事務(wù)系統(tǒng)來(lái)說(shuō),SSD較低的延遲可以使其從中受益,邊緣應(yīng)用也是如此,在這種應(yīng)用中,小型物聯(lián)網(wǎng)或設(shè)備傳感器事件流的每條事件數(shù)據(jù)記錄承載了千字節(jié),尤其是在工作負(fù)載規(guī)模較大時(shí)。
在這些情況下,閃存SSD要比HDD更具優(yōu)勢(shì),因?yàn)殚W存SSD具有更低的延遲和更高的每秒操作數(shù)(IoP)。在這些情況下,QLC閃存的密度是現(xiàn)有TLC閃存的兩倍,可以提供更高的性能。
當(dāng)HDD可能是更好的選擇時(shí):
IT領(lǐng)導(dǎo)者不能假設(shè)每個(gè)延遲敏感型應(yīng)用都需要SSD。企業(yè)經(jīng)常會(huì)發(fā)現(xiàn),通過(guò)在基于HDD的系統(tǒng)上運(yùn)行高IoP、延遲敏感型工作負(fù)載,特別是那些針對(duì)服務(wù)器和數(shù)據(jù)中心工作負(fù)載優(yōu)化了企業(yè)級(jí)HDD的系統(tǒng),可以獲得足夠的性能。數(shù)據(jù)歸檔就是其中一個(gè)很好的例子。
在歸檔、備份和媒體資產(chǎn)管理等應(yīng)用中,毫秒級(jí)和微秒級(jí)延遲之間的差異通常不會(huì)影響最終用戶的性能。在這些情況下,HDD可能是更好的選擇,因?yàn)镠DD可以滿足IT對(duì)于在符合性能預(yù)期或者超出預(yù)期的同時(shí)、仍然處于預(yù)算范圍內(nèi)這二者之間的平衡要求。
應(yīng)用2:擁有PB級(jí)非結(jié)構(gòu)化數(shù)據(jù)情況下對(duì)TCO的考量
最近,業(yè)界就高密度閃存SSD或者HDD是否更適用于非結(jié)構(gòu)化數(shù)據(jù)應(yīng)用(例如富媒體文件或傳感器數(shù)據(jù))存儲(chǔ)展開(kāi)了爭(zhēng)論。SSD支持者認(rèn)為,最新版本的閃存在容量成本方面實(shí)際上能夠與HDD“持平”,甚至有人預(yù)測(cè)高密度閃存SSD將很快取代HDD,因?yàn)榍罢呖梢愿玫赝瓿伤腥蝿?wù)。
然而,如今高密度SSD在性價(jià)比方面還無(wú)法完全取代HDD,特別是在作為整個(gè)應(yīng)用工作負(fù)載的PB級(jí)非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)的時(shí)候。通過(guò)結(jié)合閃存和HDD來(lái)實(shí)現(xiàn)各自優(yōu)勢(shì),我們通常可以實(shí)現(xiàn)性能、長(zhǎng)期耐用性、容量和經(jīng)濟(jì)性的理想組合,這實(shí)際上是要針對(duì)特定情況利用每種存儲(chǔ)介質(zhì)的優(yōu)勢(shì),并選擇最適合每種工作負(fù)載的恰當(dāng)?shù)拇鎯?chǔ)介質(zhì)。
在提供大規(guī)模可靠性方面,HDD可能是理想的選擇,當(dāng)前云數(shù)據(jù)中心有90%的存儲(chǔ)容量仍然基于HDD的,這一事實(shí)就證明了這一點(diǎn)。
應(yīng)用3:輔助存儲(chǔ)或備份
一般來(lái)說(shuō),備份應(yīng)用要讀取更大的文件有效負(fù)載并將其寫(xiě)入存儲(chǔ)。就存儲(chǔ)系統(tǒng)的性能要求而言,這些工作負(fù)載幾乎與隨機(jī)IO、延遲敏感型工作負(fù)載是完全相反的。
當(dāng)備份應(yīng)用能夠快速順序訪問(wèn)巨大的備份數(shù)據(jù)文件時(shí),備份應(yīng)用的性能最佳,吞吐量為每秒千兆字節(jié)(或每小時(shí)兆兆字節(jié))。此外,由于當(dāng)前大多數(shù)企業(yè)組織都有數(shù)百個(gè)關(guān)鍵任務(wù)應(yīng)用,因此資源必須同時(shí)并行處理多個(gè)備份和恢復(fù)任務(wù)。使用共享存儲(chǔ)系統(tǒng)來(lái)防止傳統(tǒng)存儲(chǔ)孤島的蔓延,從經(jīng)濟(jì)角度來(lái)說(shuō)是有意義的。
對(duì)于這種類型的順序IO工作負(fù)載來(lái)說(shuō),QLC閃存解決方案和基于HDD的解決方案,二者之間的區(qū)別可以忽略不計(jì)。基于HDD的對(duì)象存儲(chǔ)解決方案能夠?qū)崿F(xiàn)數(shù)十GB/秒,吞吐量足以使網(wǎng)絡(luò)飽和。這一點(diǎn)至關(guān)重要,因?yàn)檫@里的性能限制因素不是存儲(chǔ)系統(tǒng),而是網(wǎng)絡(luò)。
此外,隨著應(yīng)用處理、重復(fù)數(shù)據(jù)刪除/壓縮和數(shù)據(jù)重組時(shí)間成為備份和恢復(fù)的關(guān)鍵時(shí)間考慮因素,應(yīng)用本身可能成為整體解決方案性能的限制因素。因此,HDD和閃存SSD之間的吞吐量增量差異通??梢员徽J(rèn)為是微不足道的,特別是在分析中考慮成本的時(shí)候。
小結(jié):選擇使用HDD還是SSD取決于性能與成本之間的平衡
優(yōu)化千萬(wàn)億級(jí)應(yīng)用的性能,這可能取決于在為應(yīng)用需求匹配恰當(dāng)?shù)拇鎯?chǔ)時(shí)一個(gè)微妙但很重要的考慮因素。QLC閃存并不是一種萬(wàn)能的選擇。對(duì)于延遲敏感型、讀取密集型工作負(fù)載來(lái)說(shuō),較高的成本可以為最終用戶帶來(lái)有意義的好處。然而,這并不總是適合其他類型的工作負(fù)載,其中就包括了備份——現(xiàn)代數(shù)據(jù)和勒索軟件安全策略的核心。
通過(guò)將性能模式與介質(zhì)的優(yōu)勢(shì)和成本相匹配,數(shù)據(jù)中心團(tuán)隊(duì)就可以在性能和成本之間取得完美的平衡。
本文標(biāo)題:針對(duì)萬(wàn)億級(jí)應(yīng)用,如何更好的優(yōu)化數(shù)據(jù)中心效率?
本文鏈接:http://www.yangziriver.cn/faq3/774.html [版權(quán)聲明]除非特別標(biāo)注,否則均為本站原創(chuàng)文章,轉(zhuǎn)載時(shí)請(qǐng)以鏈接形式注明文章出處。