如何進(jìn)行vsan的容量設(shè)備故障和緩存設(shè)備故障分析,很多新手對此不是很清楚,為了幫助大家解決這個(gè)難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來學(xué)習(xí)下,希望你能有所收獲。
成都創(chuàng)新互聯(lián)公司專注為客戶提供全方位的互聯(lián)網(wǎng)綜合服務(wù),包含不限于成都網(wǎng)站設(shè)計(jì)、成都做網(wǎng)站、坡頭網(wǎng)絡(luò)推廣、成都微信小程序、坡頭網(wǎng)絡(luò)營銷、坡頭企業(yè)策劃、坡頭品牌公關(guān)、搜索引擎seo、人物專訪、企業(yè)宣傳片、企業(yè)代運(yùn)營等,從售前售中售后,我們都將竭誠為您服務(wù),您的肯定,是我們最大的嘉獎;成都創(chuàng)新互聯(lián)公司為所有大學(xué)生創(chuàng)業(yè)者提供坡頭建站搭建服務(wù),24小時(shí)服務(wù)熱線:028-86922220,官方網(wǎng)址:www.cdcxhl.com
容量設(shè)備故障解析:
磁盤故障可能是任何存儲環(huán)境中最常見的故障了,vsan也不例外。磁盤組是vSAN的管理結(jié)構(gòu),其中包括一個(gè)緩存設(shè)備和一個(gè)或多個(gè)容量設(shè)備,其容量設(shè)備的磁盤多為SATA盤。一臺主機(jī)可以為VSAN提供最多 5 個(gè)磁盤組:每個(gè)磁盤組需要 1 個(gè) SDD 以及最少 1 個(gè)、最多 6 個(gè)HDD。每個(gè)主機(jī)的最多 HDD 數(shù)為 5 x 6 = 30。每個(gè)主機(jī)的最多 SSD 數(shù)為 5 x 1 = 5。
在日常運(yùn)維中,一般采用精簡配置,虛擬機(jī)的虛擬磁盤僅占用實(shí)際數(shù)據(jù)的使用空間,大量地節(jié)省了成本。但是,在無人監(jiān)控、空間快速增長的情況下,可能會發(fā)生存儲空間超額分配,引發(fā)業(yè)務(wù)應(yīng)用性能下降,甚至無法工作。
那么VSAN如何處理容量磁盤故障呢?如果故障發(fā)生時(shí),正好在磁盤上有一個(gè)讀或?qū)懙牟僮鲿l(fā)生什么呢?下面解析下vsan的容量設(shè)備故障。
如圖,比如exsi-03上的一個(gè)容量存儲組件返回一個(gè)讀錯(cuò)誤,那么VSAN就會去檢查是否存在副本組件,如果有則從那個(gè)副本上讀取。默認(rèn)情況下,每個(gè)對象被創(chuàng)建時(shí)都配置成FTT為1,這意味著每個(gè)對象總有2個(gè)完全一樣的副本組件可用。故障發(fā)生在讀取時(shí),有2種不同的情況,第一種情況可以修復(fù),第二種情況則無法修復(fù)。當(dāng)問題是可以修復(fù)的時(shí)候,I/O錯(cuò)誤會被匯報(bào)給對象的屬主,對象的屬主則會發(fā)起組件重構(gòu)。當(dāng)組件重構(gòu)完成時(shí),故障組件會被刪除。然而,如果因?yàn)槟撤N原因,沒有副本組件存在時(shí),VSAN就會報(bào)告這個(gè)虛擬機(jī)出現(xiàn)了I/O錯(cuò)誤。
如果是返回一個(gè)寫錯(cuò)誤,也會傳送到對象屬主,組件會被標(biāo)注為“已降級”并會在VSAN群集中另外的磁盤上觸發(fā)組件重構(gòu)。當(dāng)組件重構(gòu)完成時(shí),群集目錄會被更新。注意,閃存設(shè)備(它沒有出錯(cuò))會繼續(xù)用緩存來提供讀取服務(wù)。
最初的vsan版本中,在某一個(gè)組件或多個(gè)組件因故障而處以重建過程中時(shí),vsphere web客戶端并沒有顯示有多少數(shù)據(jù)需要同步。但從vsan6.0起,vsphere web客戶端提供了在故障發(fā)生時(shí)監(jiān)控?cái)?shù)據(jù)同步狀況的功能,比如它會顯示正在重新同步的組件數(shù)量、重新同步的剩余字節(jié)數(shù)以及完成重新同步所需要的時(shí)間。
注:當(dāng)磁盤容量全滿時(shí),vSAN會暫停寫數(shù)據(jù)并為寫請求申請新的磁盤空間,如果未及時(shí)添加新的磁盤,則vsan寫操作會出現(xiàn)錯(cuò)誤,引發(fā)虛擬機(jī)I/O錯(cuò)誤。
緩存設(shè)備故障解析:
如果緩存設(shè)備SSD不可訪問會發(fā)生什么情況?當(dāng)緩存設(shè)備不可訪問時(shí),同一個(gè)磁盤組中那個(gè)緩存設(shè)備支持的所有容量設(shè)備都會無法被訪問。緩存設(shè)備故障等同于緩存設(shè)備背后的所有容量設(shè)備故障。從本質(zhì)上說,當(dāng)一個(gè)緩存設(shè)備故障時(shí),整個(gè)磁盤組被認(rèn)為是“已降級的”。如果VSAN群集中有多余的容量,它就會試圖在另一臺主機(jī)或磁盤上重新配置存儲對象。因此,從架構(gòu)決策角度看,根據(jù)使用的主機(jī)類型不同,創(chuàng)建多個(gè)小的磁盤組可能會比單個(gè)大磁盤組好,因?yàn)橐粋€(gè)磁盤組可以被視為一個(gè)故障域。
注:VSAN采用電梯算法周期性地將緩存層內(nèi)寫緩存中的數(shù)據(jù)按照地址順序“沖刷”進(jìn)磁盤中,這是一個(gè)能進(jìn)行自我調(diào)整的算法,它決定了SSD回寫到磁盤的頻率。當(dāng)exsi-01虛擬機(jī)中的應(yīng)用程序發(fā)起一個(gè)寫操作時(shí),對象屬主會克隆這個(gè)寫操作。并發(fā)的寫請求通過萬兆網(wǎng)絡(luò)發(fā)往exsi-02和exsi-03上的寫緩存,當(dāng)數(shù)據(jù)寫入緩存時(shí),寫就被確認(rèn)了,此時(shí)SSD上的準(zhǔn)備操作就完成了。屬主等待所有2臺主機(jī)的ACK信號后完成I/O。稍后這個(gè)寫入會作為批量處理的一部分最終回寫到磁盤上。各主機(jī)的回寫操作都是相互獨(dú)立的,也就是說,exsi-02和exsi-03上的回寫操作時(shí)間可能是不同的。這是因?yàn)椴煌鳈C(jī)的情況不同,比如緩存空間填滿的速度、剩余空間的大小以及數(shù)據(jù)將存放在磁盤的什么地方都可能是不同的。
補(bǔ)充:
容量大小設(shè)置準(zhǔn)則
1、至少留有 30% 的未使用空間,以防止 vSAN 重新平衡存儲負(fù)載。只要單個(gè)容量設(shè)備上的消耗達(dá)到 80% 或以上,vSAN 就會重新平衡群集中的組件。重新平衡操作可能會影響應(yīng)用程序的性能。要避免這些問題,存儲消耗應(yīng)低于 70%。
2、規(guī)劃額外容量,用于處理潛在故障或替換容量設(shè)備、磁盤組和主機(jī)。當(dāng)某個(gè)容量設(shè)備無法訪問時(shí),vSAN 會在群集中的其他設(shè)備中恢復(fù)組件。當(dāng)閃存緩存設(shè)備出現(xiàn)故障或移除時(shí),vSAN 會從整個(gè)磁盤組中恢復(fù)組件。
3、預(yù)留額外容量以確保 vSAN 在出現(xiàn)主機(jī)故障或主機(jī)進(jìn)入維護(hù)模式時(shí)恢復(fù)組件。例如,置備具有足夠容量的主機(jī),以便留有足夠的可用容量供可在主機(jī)出現(xiàn)故障或維護(hù)期間成功進(jìn)行重新構(gòu)建組件。存在三個(gè)以上的主機(jī)時(shí)這非常重要,這樣您才有足夠的可用容量來重新構(gòu)建故障的組件。如果主機(jī)出現(xiàn)故障,將在其他主機(jī)的可用存儲上進(jìn)行重新構(gòu)建,這樣可以允許再次出現(xiàn)故障。但是,在三主機(jī)群集中,如果將允許的故障數(shù)主要級別設(shè)置為 1,則 vSAN 不會執(zhí)行重新構(gòu)建操作,因?yàn)樵谝粋€(gè)主機(jī)出現(xiàn)故障后,群集中只剩下兩個(gè)主機(jī)。要允許故障后重新構(gòu)建,至少必須有三個(gè)主機(jī)。
4、提供足夠的臨時(shí)存儲空間,以便在 vSAN 虛擬機(jī)存儲策略中進(jìn)行更改。動態(tài)更改虛擬機(jī)存儲策略時(shí),vSAN 可能會為組成對象的副本創(chuàng)建一個(gè)布局。當(dāng) vSAN 實(shí)例化這些副本并將其與原始副本進(jìn)行同步時(shí),群集必須臨時(shí)提供額外空間。
5、如果規(guī)劃使用軟件校驗(yàn)和或去重和壓縮等高級功能,請保留額外的空間以處理操作開銷。
問題補(bǔ)充:
SSD 擁堵問題引發(fā)VSAN夯住。這時(shí)特定磁盤組的寫入 IO 的活動工作集顯著大于該磁盤組緩存層的大小時(shí),通常會引發(fā) SSD 擁堵,繼而引發(fā)VSAN群集夯住。在混合和全閃存 vSAN 群集中,數(shù)據(jù)首先寫入到寫入緩存(也稱為寫入緩沖區(qū))。一個(gè)稱為降級轉(zhuǎn)儲的進(jìn)程會將數(shù)據(jù)從寫入緩沖區(qū)移至容量磁盤。寫入緩存承受較高的寫入速率,從而確保寫入性能不受容量磁盤的限制。不過,如果以非常快的速率填充寫入緩存,降級轉(zhuǎn)儲進(jìn)程可能跟不上到達(dá) IO 的速率。在這種情況下,會引發(fā) SSD 擁堵,需要指示 vSAN DOM 客戶端層將 IO 減速到 vSAN 磁盤組可以處理的速率。
補(bǔ)救措施:要避免 SSD 擁堵,請調(diào)整所用的虛擬機(jī)磁盤的大小。為達(dá)到最佳效果,我們建議虛擬機(jī)磁盤(活動工作集)的大小不超過所有磁盤組寫入緩存累計(jì)大小的 40%。請注意,對于混合 vSAN 群集,寫入緩存的大小為緩存層磁盤大小的 30%。在全閃存群集中,寫入緩存的大小是緩存層磁盤的大小,但不應(yīng)超過 600 GB。如果超限大量寫入,容易引起VSAN群集夯住,容量層磁盤也將會無法被訪問。
看完上述內(nèi)容是否對您有幫助呢?如果還想對相關(guān)知識有進(jìn)一步的了解或閱讀更多相關(guān)文章,請關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝您對創(chuàng)新互聯(lián)的支持。