M+N數(shù)據(jù)鏡像熱備份方案
方案簡述
企事業(yè)機(jī)構(gòu)的信息化建設(shè)已經(jīng)在隨著社會建設(shè)的不斷推進(jìn)而改進(jìn)和創(chuàng)新。眾企事業(yè)機(jī)構(gòu)的決策層也愈發(fā)重視企事業(yè)機(jī)構(gòu)的信息化,不同程度的運(yùn)營和發(fā)展著自身的業(yè)務(wù)信息系統(tǒng)。但是日趨普遍的業(yè)務(wù)信息系統(tǒng)在為企事業(yè)機(jī)構(gòu)帶來利益的同時,也存在著一個不容忽視的隱患——越來越多的業(yè)務(wù)依賴于業(yè)務(wù)信息系統(tǒng)。如果運(yùn)行著關(guān)鍵業(yè)務(wù)信息系統(tǒng)的服務(wù)器發(fā)生宕機(jī)或是因?yàn)椴豢煽氐脑蚨V梗瑥亩鴮?dǎo)致整個企事業(yè)機(jī)構(gòu)的信息運(yùn)營系統(tǒng)癱瘓,將會給企事業(yè)機(jī)構(gòu)帶來巨大的經(jīng)濟(jì)損失,而由于企事業(yè)機(jī)構(gòu)的業(yè)務(wù)不能正常運(yùn)行也會影響企事業(yè)機(jī)構(gòu)的信譽(yù),導(dǎo)致客戶對企事業(yè)機(jī)構(gòu)失去信任,從而帶來致命的危害。
通常,服務(wù)因錯誤而造成的終止不可避免,為此,企事業(yè)機(jī)構(gòu)都會安排相關(guān)的管理人員進(jìn)行定時的監(jiān)控,一旦發(fā)現(xiàn)服務(wù)不可用,便會立即進(jìn)行處理、排錯。這是非常原始的解決方案,存在諸多問題,譬如及時性問題,一旦錯誤在深夜發(fā)生, 而人工不可能24小時監(jiān)控;再譬如處理時間長短不可控,一旦錯誤造成的原因非常復(fù)雜,排錯非常困難,需要非常長的時間,那么服務(wù)的終止將非常長。在排錯過程中,人為操作失誤將可能導(dǎo)致系統(tǒng)的永久癱瘓。另一方面,為了維持系統(tǒng)的高可用性而配備操作人員,勞務(wù)費(fèi)用也非常昂貴。
可見,業(yè)務(wù)信息系統(tǒng)的容錯性和不間斷性對需要保障信息安全和提供不間斷的信息服務(wù)的企事業(yè)機(jī)構(gòu)至關(guān)重要。而當(dāng)今企事業(yè)機(jī)構(gòu)和IT領(lǐng)域急需解決的關(guān)鍵問題在于如何保障各種關(guān)鍵應(yīng)用的不間斷運(yùn)營,達(dá)到持久穩(wěn)定的良性循環(huán)。
為了解決上述問題,一般采用服務(wù)器熱備份方案,也就是通過硬件冗余再配合高可用軟件實(shí)現(xiàn)的解決方案,高可用軟件自動檢測服務(wù)的運(yùn)行狀態(tài),當(dāng)主服務(wù)器發(fā)生故障,高可用軟件會自動嘗試修復(fù)故障或啟動備用服務(wù)器,保證我們的服務(wù)不間斷運(yùn)行。
方案梗概
客戶擁有多臺服務(wù)器(兩臺或兩臺以上),根據(jù)實(shí)際服務(wù)器應(yīng)用情況,將服務(wù)器規(guī)劃為針對不同應(yīng)用的M臺主服務(wù)器與N臺備用服務(wù)器,即形成多個互為備份組合,其中每臺服務(wù)器既做為某應(yīng)用主服務(wù)器同時又可能做為其他應(yīng)用的備用服務(wù)器,形成M+N的服務(wù)器熱備份形式,在服務(wù)器中均安裝 ServHA Cloud高可用軟件產(chǎn)品,ServHA Cloud高可用軟件產(chǎn)品負(fù)責(zé)實(shí)時檢測服務(wù)器故障并進(jìn)行應(yīng)用數(shù)據(jù)的實(shí)時同步,一旦運(yùn)行應(yīng)用的主服務(wù)器發(fā)生故障,規(guī)劃中的對應(yīng)備用服務(wù)器將自動接替故障主服務(wù)器的業(yè)務(wù)應(yīng)用,保證客戶核心業(yè)務(wù)7*24小時不間斷運(yùn)行,這一過程只需要幾秒鐘至幾分鐘,遠(yuǎn)遠(yuǎn)快于人工操作,保護(hù)了客戶的利益,如下圖所示:
方案構(gòu)架
方案要求:
方案拓?fù)淙缦拢?
此部署形式中,私網(wǎng)的心跳和數(shù)據(jù)同步鏈路作為主要的鏈路,連接公網(wǎng)交換機(jī)的鏈路作為備份冗余鏈路,如此部署可使數(shù)據(jù)同步不占用業(yè)務(wù)的帶寬,達(dá)到最好的效果。
故障處理
在此部署方案中,各服務(wù)器是對等的,沒有絕對的主服務(wù)器和備用服務(wù)器,每個應(yīng)用均有各自的備用服務(wù)器與其相對應(yīng),若其中任意服務(wù)器發(fā)生故障后,其對應(yīng)的一臺或多臺備用服務(wù)器將接管對應(yīng)應(yīng)用,保護(hù)業(yè)務(wù)不間斷運(yùn)行。
方案優(yōu)點(diǎn)
資源利用率高,服務(wù)器不呈閑置狀態(tài),每臺服務(wù)器均運(yùn)行應(yīng)用。
節(jié)省硬件投入,無需昂貴的磁盤陣列柜即可實(shí)現(xiàn)業(yè)務(wù)應(yīng)用高可用。
集群中每個應(yīng)用的業(yè)務(wù)數(shù)據(jù)均是雙份存儲,提高數(shù)據(jù)安全性
可將應(yīng)用靈活分布至不同服務(wù)器,不會造成單個服務(wù)器同時運(yùn)行多個應(yīng)用從而導(dǎo)致的負(fù)載過高
不要求服務(wù)器配置的統(tǒng)一,利用現(xiàn)有硬件即可實(shí)現(xiàn)高可用。
無縫的添加新的應(yīng)用、新的服務(wù)器節(jié)點(diǎn)。
故障發(fā)生時,切換速度快,極大的減少業(yè)務(wù)中斷時間。
管理員可進(jìn)行遠(yuǎn)程管理、監(jiān)控,在安全范圍內(nèi)用任意瀏覽器即可管理集群。
故障自動恢復(fù)、自動切換,實(shí)現(xiàn)無人值守。