N+1共享存儲(chǔ)熱備份方案
方案簡(jiǎn)述
企事業(yè)機(jī)構(gòu)的信息化建設(shè)已經(jīng)在隨著社會(huì)建設(shè)的不斷推進(jìn)而改進(jìn)和創(chuàng)新。眾企事業(yè)機(jī)構(gòu)的決策層也愈發(fā)重視企事業(yè)機(jī)構(gòu)的信息化,不同程度的運(yùn)營(yíng)和發(fā)展著自身的業(yè)務(wù)信息系統(tǒng)。但是日趨普遍的業(yè)務(wù)信息系統(tǒng)在為企事業(yè)機(jī)構(gòu)帶來(lái)利益的同時(shí),也存在著一個(gè)不容忽視的隱患——越來(lái)越多的業(yè)務(wù)依賴于業(yè)務(wù)信息系統(tǒng)。如果運(yùn)行著關(guān)鍵業(yè)務(wù)信息系統(tǒng)的服務(wù)器發(fā)生宕機(jī)或是因?yàn)椴豢煽氐脑蚨V?,從而?dǎo)致整個(gè)企事業(yè)機(jī)構(gòu)的信息運(yùn)營(yíng)系統(tǒng)癱瘓,將會(huì)給企事業(yè)機(jī)構(gòu)帶來(lái)巨大的經(jīng)濟(jì)損失,而由于企事業(yè)機(jī)構(gòu)的業(yè)務(wù)不能正常運(yùn)行也會(huì)影響企事業(yè)機(jī)構(gòu)的信譽(yù),導(dǎo)致客戶對(duì)企事業(yè)機(jī)構(gòu)失去信任,從而帶來(lái)致命的危害。
通常,服務(wù)因錯(cuò)誤而造成的終止不可避免,為此,企事業(yè)機(jī)構(gòu)都會(huì)安排相關(guān)的管理人員進(jìn)行定時(shí)的監(jiān)控,一旦發(fā)現(xiàn)服務(wù)不可用,便會(huì)立即進(jìn)行處理、排錯(cuò)。這是非常原始的解決方案,存在諸多問(wèn)題,譬如及時(shí)性問(wèn)題,一旦錯(cuò)誤在深夜發(fā)生, 而人工不可能24小時(shí)監(jiān)控;再譬如處理時(shí)間長(zhǎng)短不可控,一旦錯(cuò)誤造成的原因非常復(fù)雜,排錯(cuò)非常困難,需要非常長(zhǎng)的時(shí)間,那么服務(wù)的終止將非常長(zhǎng)。在排錯(cuò)過(guò)程中,人為操作失誤將可能導(dǎo)致系統(tǒng)的永久癱瘓。另一方面,為了維持系統(tǒng)的高可用性而配備操作人員,勞務(wù)費(fèi)用也非常昂貴。
可見(jiàn),業(yè)務(wù)信息系統(tǒng)的容錯(cuò)性和不間斷性對(duì)需要保障信息安全和提供不間斷的信息服務(wù)的企事業(yè)機(jī)構(gòu)至關(guān)重要。而當(dāng)今企事業(yè)機(jī)構(gòu)和IT領(lǐng)域急需解決的關(guān)鍵問(wèn)題在于如何保障各種關(guān)鍵應(yīng)用的不間斷運(yùn)營(yíng),達(dá)到持久穩(wěn)定的良性循環(huán)。
為了解決上述問(wèn)題,一般采用服務(wù)器熱備份方案,也就是通過(guò)硬件冗余再配合高可用軟件實(shí)現(xiàn)的解決方案,高可用軟件自動(dòng)檢測(cè)服務(wù)的運(yùn)行狀態(tài),當(dāng)主服務(wù)器發(fā)生故障,高可用軟件會(huì)自動(dòng)嘗試修復(fù)故障或啟動(dòng)備用服務(wù)器,保證我們的服務(wù)不間斷運(yùn)行。
方案梗概
客戶擁有多臺(tái)服務(wù)器(兩臺(tái)或兩臺(tái)以上)以及共享存儲(chǔ)設(shè)備(一般情況下為磁盤陣列柜),服務(wù)器同時(shí)連接至共享存儲(chǔ),根據(jù)實(shí)際服務(wù)器應(yīng)用情況,將服務(wù)器規(guī)劃為N臺(tái)主服務(wù)器與一臺(tái)備用服務(wù)器,形成N+1的服務(wù)器熱備份形式,在服務(wù)器中均安裝 ServHA Cloud高可用軟件產(chǎn)品,在共享存儲(chǔ)中根據(jù)應(yīng)用的需求劃分出相應(yīng)的LUN,并將業(yè)務(wù)數(shù)據(jù)存放至共享存儲(chǔ)內(nèi),一旦運(yùn)行應(yīng)用的主服務(wù)器發(fā)生故障,規(guī)劃中的備用服務(wù)器將自動(dòng)接替故障主服務(wù)器的業(yè)務(wù)應(yīng)用,保證客戶核心業(yè)務(wù)7*24小時(shí)不間斷運(yùn)行,這一過(guò)程只需要幾秒鐘至幾分鐘,遠(yuǎn)遠(yuǎn)快于人工操作,保護(hù)了客戶的利益,如下圖所示:
方案構(gòu)架
方案要求:
方案拓?fù)淙缦拢?
故障處理
當(dāng)任意主服務(wù)器發(fā)生故障(如服務(wù)器宕機(jī)、掉電、網(wǎng)絡(luò)故障、應(yīng)用意外崩潰等),備用服務(wù)器將自動(dòng)接替服務(wù),保護(hù)業(yè)務(wù)不間斷運(yùn)行,同時(shí)利用虛擬IP技術(shù),用戶的訪問(wèn)IP也不會(huì)發(fā)生變化。
方案優(yōu)點(diǎn)
能夠支持大數(shù)據(jù)吞吐量和具有良好的數(shù)據(jù)擴(kuò)展性且不要求服務(wù)器配置的統(tǒng)一。
可無(wú)縫添加新的應(yīng)用新的節(jié)點(diǎn),備用服務(wù)器相對(duì)獨(dú)立,部署簡(jiǎn)單、明晰。
故障發(fā)生時(shí),切換速度快,極大的減少業(yè)務(wù)中斷時(shí)間。
管理員可進(jìn)行遠(yuǎn)程管理、監(jiān)控,在安全范圍內(nèi)用任意瀏覽器即可管理集群。
故障自動(dòng)恢復(fù)、自動(dòng)切換,實(shí)現(xiàn)無(wú)人值守。