IT架構(gòu)是指由服務(wù)器、存儲、網(wǎng)絡(luò)、操作系統(tǒng)、數(shù)據(jù)庫、中間件以及各類管理工具等共同構(gòu)成的IT運(yùn)營環(huán)境。提升IT架構(gòu)的可用性可以明顯提升IT系統(tǒng)整體的可用性、安全性和持續(xù)性。要實(shí)現(xiàn)IT架構(gòu)的高可用性,不僅需要在數(shù)據(jù)中心基礎(chǔ)設(shè)施方面實(shí)現(xiàn)高可用性,還需要在服務(wù)器、存儲、網(wǎng)絡(luò)、操作系統(tǒng)、數(shù)據(jù)庫、中間件等方面滿足高可用性需求。
成都創(chuàng)新互聯(lián)專注于玉龍網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗(yàn)。 熱誠為您提供玉龍營銷型網(wǎng)站建設(shè),玉龍網(wǎng)站制作、玉龍網(wǎng)頁設(shè)計(jì)、玉龍網(wǎng)站官網(wǎng)定制、小程序設(shè)計(jì)服務(wù),打造玉龍網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供玉龍網(wǎng)站排名全網(wǎng)營銷落地服務(wù)。主機(jī)系統(tǒng)高可用性解決方案
當(dāng)應(yīng)用系統(tǒng)的主機(jī)發(fā)生故障時,可利用主機(jī)的集群技術(shù)來解決,當(dāng)一臺主機(jī)發(fā)生故障后,業(yè)務(wù)系統(tǒng)會自動切換到其它主機(jī)繼續(xù)提供服務(wù)。目前,主機(jī)的群集主要分為本地群集和遠(yuǎn)程異地群集兩種,群集方式主要包括主備方式、互備方式和并發(fā)方式。
主備方式采用N+1備份方式,即用1臺主機(jī)作為多臺主機(jī)的備份主機(jī),當(dāng)某一臺生產(chǎn)主機(jī)發(fā)生故障時,用備份主機(jī)接替生產(chǎn)主機(jī)運(yùn)行。
互備方式一般是兩臺主機(jī)分別運(yùn)行不同的應(yīng)用系統(tǒng),互為備份,當(dāng)某一臺主機(jī)的某個應(yīng)用系統(tǒng)發(fā)生故障時,啟用另一臺主機(jī)的備份系統(tǒng)運(yùn)行。
并發(fā)方式一般是多臺主機(jī)運(yùn)行同一個應(yīng)用系統(tǒng),并實(shí)現(xiàn)負(fù)載均衡,當(dāng)某一臺主機(jī)出現(xiàn)故障時,其他主機(jī)接管故障主機(jī),并重新進(jìn)行負(fù)載均衡。
存儲系統(tǒng)高可用性解決方案
對于單一存儲配置,可通過磁盤RAID技術(shù)加熱備磁盤來解決,對于存儲本身一般都采用雙磁盤控制器和雙電源實(shí)現(xiàn)冗余配置;當(dāng)磁盤發(fā)生故障時可以通過熱備磁盤及時替換來進(jìn)行故障處理,當(dāng)存儲控制器故障時可以實(shí)現(xiàn)連個控制器的自動切換。電源故障時有冗余電源,不會因造成存儲的故障造成數(shù)據(jù)庫的數(shù)據(jù)丟失。
對于冗余存儲配置,采用冗余存儲,利用存儲之間的鏡像技術(shù),使數(shù)據(jù)同時保存在兩個存儲上;或者邏輯卷鏡像的方式來實(shí)現(xiàn)存儲系統(tǒng)的高可用性,采用多路徑技術(shù)將業(yè)務(wù)數(shù)據(jù)分別保存在兩個存儲或者兩個不同的邏輯卷上,當(dāng)一個存儲或者一個邏輯卷發(fā)生故障,數(shù)據(jù)庫主機(jī)系統(tǒng)會自動切換到另外一臺存儲或者另外一個可用的邏輯卷上。
網(wǎng)絡(luò)高可用性解決方案
在多個數(shù)據(jù)中心網(wǎng)絡(luò)系統(tǒng)的建設(shè)中需要遵循有關(guān)的網(wǎng)絡(luò)互聯(lián)標(biāo)準(zhǔn)、規(guī)范,選用合適的網(wǎng)絡(luò)互聯(lián)技術(shù)及產(chǎn)品(包括交換,路由及接入設(shè)備),依托公共通信設(shè)施可提供的通信環(huán)境,采用完備的網(wǎng)絡(luò)設(shè)備構(gòu)筑起一個結(jié)構(gòu)合理、性能良好、安全可靠的網(wǎng)絡(luò)通信平臺,在其基礎(chǔ)上可以實(shí)現(xiàn)高質(zhì)量的數(shù)據(jù)和圖像、文件等的通信、復(fù)制服務(wù),達(dá)到提供高質(zhì)量通信服務(wù)的目標(biāo)。
網(wǎng)絡(luò)系統(tǒng)作為承載業(yè)務(wù)系統(tǒng)的基礎(chǔ),系統(tǒng)的高可用性是保證業(yè)務(wù)連續(xù)性要求的重要保證,網(wǎng)絡(luò)系統(tǒng)的短時間中斷就可能影響大量業(yè)務(wù),造成不可挽回的重大損失。
因此多中心的網(wǎng)絡(luò)系統(tǒng)建設(shè)應(yīng)具備完整容錯能力和最小網(wǎng)絡(luò)故障恢復(fù)時間,網(wǎng)絡(luò)的結(jié)構(gòu)應(yīng)具有冗余性及可恢復(fù)性,網(wǎng)絡(luò)設(shè)備的高可用性,充分保證了網(wǎng)絡(luò)系統(tǒng)的整體高可用性。由于業(yè)務(wù)連續(xù)性的要求,99.999%的網(wǎng)絡(luò)高可用(一年中不能提供服務(wù)的時間在5分鐘左右),已經(jīng)開始成為雙中心網(wǎng)絡(luò)建設(shè)的基本要求。
為保證雙中心網(wǎng)絡(luò)系統(tǒng)的高可用性需從以下幾方面考慮:
網(wǎng)絡(luò)設(shè)備的冗余設(shè)計(jì)
在網(wǎng)絡(luò)設(shè)備的選擇上應(yīng)考慮設(shè)備自身冗余配置,包括設(shè)備自身的冗余電源及風(fēng)扇、冗余引擎、無源備板、冗余控制單元、冗余內(nèi)存單元、冗余數(shù)據(jù)存儲單元、冗余端口等設(shè)計(jì),可以有效減少設(shè)備自身故障導(dǎo)致的業(yè)務(wù)系統(tǒng)中斷。
網(wǎng)絡(luò)連接架構(gòu)冗余設(shè)計(jì)
在層次化結(jié)構(gòu)的網(wǎng)絡(luò)系統(tǒng)中,接入層、匯聚層、核心層之間的連接需配置多條冗余鏈路,并可以實(shí)現(xiàn)鏈路之間的自動切換,以保證故障發(fā)生時最小的中斷時間。
數(shù)據(jù)中心的網(wǎng)絡(luò)系統(tǒng)與各外聯(lián)機(jī)構(gòu)的連接線路類型、數(shù)量、運(yùn)營商及帶寬都應(yīng)有所不同,當(dāng)每個外聯(lián)都有兩條或兩條以上不同運(yùn)營商線路連接的情況,采用相應(yīng)的線路自愈技術(shù),可以實(shí)現(xiàn)線路的快速接替,避免由于運(yùn)營商的問題造成對業(yè)務(wù)的影響。
網(wǎng)絡(luò)設(shè)備的業(yè)務(wù)連續(xù)性機(jī)制
在多中心網(wǎng)絡(luò)系統(tǒng)設(shè)計(jì)中,核心設(shè)備以及關(guān)鍵設(shè)備需在不停機(jī)情況下,實(shí)現(xiàn)不停機(jī)擴(kuò)容、維護(hù)、升級等服務(wù),提高性能以滿足新的業(yè)務(wù)需求,并具有7×24×365連續(xù)工作的能力。
數(shù)據(jù)庫高可用解決方案
數(shù)據(jù)庫的高可用性是建立在主機(jī)高可用性的基礎(chǔ)之上的,必須要用高可用的主機(jī)集群和高可用性的存儲來保證。數(shù)據(jù)庫的高可用性解決方案可實(shí)現(xiàn)不同場景下的數(shù)據(jù)恢復(fù)和業(yè)務(wù)連續(xù)性。
對于主機(jī)故障導(dǎo)致的業(yè)務(wù)中斷,可通過數(shù)據(jù)庫群集技術(shù),如Oracle RAC(Real Application Cluster)技術(shù),實(shí)現(xiàn)數(shù)據(jù)庫的無縫連接,當(dāng)一個主機(jī)系統(tǒng)發(fā)生故障時,業(yè)務(wù)系統(tǒng)無需中斷,可以繼續(xù)連接到集群中的其它數(shù)據(jù)庫服務(wù)器上進(jìn)行業(yè)務(wù)操作,保持業(yè)務(wù)的連續(xù)性。
對于人為誤操作導(dǎo)致的業(yè)務(wù)中斷,可采用數(shù)據(jù)庫回滾操作,或者利用恢復(fù)技術(shù)從已經(jīng)備份的數(shù)據(jù)文件中,恢復(fù)數(shù)據(jù)庫對象。同時可通過限制用戶的訪問,只允許數(shù)據(jù)庫操作人員對執(zhí)行業(yè)務(wù)實(shí)際所需的數(shù)據(jù)和服務(wù)進(jìn)行訪問,嚴(yán)格控制數(shù)據(jù)庫操作人員對數(shù)據(jù)庫的訪問權(quán)限。
對于數(shù)據(jù)損壞導(dǎo)致的業(yè)務(wù)中斷,可通過數(shù)據(jù)庫系統(tǒng)本身的備份恢復(fù)技術(shù),提供的各種形式在線備份,例如ORACLE數(shù)據(jù)庫的RMAN及exp備份以及數(shù)據(jù)文件的在線備份,SQL Server的BCP備份。當(dāng)數(shù)據(jù)庫發(fā)生文件故障時,可以利用備份文件對數(shù)據(jù)庫進(jìn)行快速恢復(fù),從而保證數(shù)據(jù)安全性。
對于站點(diǎn)故障導(dǎo)致的業(yè)務(wù)中斷,可通過在本地或遠(yuǎn)程創(chuàng)建并維護(hù)一個生產(chǎn)數(shù)據(jù)庫副本。在遭遇災(zāi)難或發(fā)生損壞事件時,數(shù)據(jù)用戶將可以通過訪問遠(yuǎn)程數(shù)據(jù)庫繼續(xù)保持工作。數(shù)據(jù)保護(hù)的最簡單形式為離線存儲數(shù)據(jù)庫備份文件。當(dāng)數(shù)據(jù)庫無法在合理的事件內(nèi)繼續(xù)提供服務(wù)時,備份文件可恢復(fù)到其它站點(diǎn)的系統(tǒng)中,從而使用戶可以連接至備份系統(tǒng)。常見的技術(shù)包括Oracle的DataGuard、Quest SharePlex for oracle、Golden Gate、DSG RealSync等技術(shù)。這些技術(shù)可以實(shí)現(xiàn)數(shù)據(jù)庫的準(zhǔn)實(shí)時復(fù)制,將數(shù)據(jù)庫的日志傳輸?shù)疆惖兀龠M(jìn)行數(shù)據(jù)庫SQL重用,將數(shù)據(jù)重新寫入到副本數(shù)據(jù)庫中,實(shí)現(xiàn)數(shù)據(jù)庫的異地站點(diǎn)保護(hù)。
對于由于數(shù)據(jù)更改導(dǎo)致的業(yè)務(wù)中斷,目前的數(shù)據(jù)庫,如Oracle可在不停機(jī)的情況下對數(shù)據(jù)庫進(jìn)行運(yùn)維。比如:為 SMP 服務(wù)器添加或刪除處理器;在線添加或刪除 RAC 集群中的節(jié)點(diǎn);動態(tài)增加共享內(nèi)存分配,自動線調(diào)整內(nèi)存;在線添加或刪除存儲,同時不影響數(shù)據(jù)庫訪問;作到在線運(yùn)維;在線移動數(shù)據(jù)庫文件;在線數(shù)據(jù)庫備份與恢復(fù)。