方案簡(jiǎn)述
企事業(yè)機(jī)構(gòu)的信息化建設(shè)已經(jīng)在隨著社會(huì)建設(shè)的不斷推進(jìn)而改進(jìn)和創(chuàng)新。眾企事業(yè)機(jī)構(gòu)的決策層也愈發(fā)重視企事業(yè)機(jī)構(gòu)的信息化,不同程度的運(yùn)營(yíng)和發(fā)展著自身的業(yè)務(wù)信息系統(tǒng)。但是日趨普遍的業(yè)務(wù)信息系統(tǒng)在為企事業(yè)機(jī)構(gòu)帶來(lái)利益的同時(shí),也存在著一個(gè)不容忽視的隱患——越來(lái)越多的業(yè)務(wù)依賴于業(yè)務(wù)信息系統(tǒng)。如果運(yùn)行著關(guān)鍵業(yè)務(wù)信息系統(tǒng)的服務(wù)器發(fā)生宕機(jī)或是因?yàn)椴豢煽氐脑蚨V梗瑥亩鴮?dǎo)致整個(gè)企事業(yè)機(jī)構(gòu)的信息運(yùn)營(yíng)系統(tǒng)癱瘓,將會(huì)給企事業(yè)機(jī)構(gòu)帶來(lái)巨大的經(jīng)濟(jì)損失,而由于企事業(yè)機(jī)構(gòu)的業(yè)務(wù)不能正常運(yùn)行也會(huì)影響企事業(yè)機(jī)構(gòu)的信譽(yù),導(dǎo)致客戶對(duì)企事業(yè)機(jī)構(gòu)失去信任,從而帶來(lái)致命的危害。
通常,服務(wù)因錯(cuò)誤而造成的終止不可避免,為此,企事業(yè)機(jī)構(gòu)都會(huì)安排相關(guān)的管理人員進(jìn)行定時(shí)的監(jiān)控,一旦發(fā)現(xiàn)服務(wù)不可用,便會(huì)立即進(jìn)行處理、排錯(cuò)。這是非常原始的解決方案,存在諸多問(wèn)題,譬如及時(shí)性問(wèn)題,一旦錯(cuò)誤在深夜發(fā)生,而人工不可能24小時(shí)監(jiān)控;再譬如處理時(shí)間長(zhǎng)短不可控,一旦錯(cuò)誤造成的原因非常復(fù)雜,排錯(cuò)非常困難,需要非常長(zhǎng)的時(shí)間,那么服務(wù)的終止將非常長(zhǎng)。在排錯(cuò)過(guò)程中,人為操作失誤將可能導(dǎo)致系統(tǒng)的永久癱瘓。另一方面,為了維持系統(tǒng)的高可用性而配備操作人員,勞務(wù)費(fèi)用也非常昂貴。
可見(jiàn),業(yè)務(wù)信息系統(tǒng)的容錯(cuò)性和不間斷性對(duì)需要保障信息安全和提供不間斷的信息服務(wù)的企事業(yè)機(jī)構(gòu)至關(guān)重要。而當(dāng)今企事業(yè)機(jī)構(gòu)和IT領(lǐng)域急需解決的關(guān)鍵問(wèn)題在于如何保障各種關(guān)鍵應(yīng)用的不間斷運(yùn)營(yíng),達(dá)到持久穩(wěn)定的良性循環(huán)。
為了解決上述問(wèn)題,一般采用服務(wù)器熱備份方案,也就是通過(guò)硬件冗余再配合高可用軟件實(shí)現(xiàn)的解決方案,高可用軟件自動(dòng)檢測(cè)服務(wù)的運(yùn)行狀態(tài),當(dāng)主服務(wù)器發(fā)生故障,高可用軟件會(huì)自動(dòng)嘗試修復(fù)故障或啟動(dòng)備用服務(wù)器,保證我們的服務(wù)不間斷運(yùn)行。
方案梗概
客戶擁有多臺(tái)服務(wù)器(兩臺(tái)或兩臺(tái)以上),根據(jù)實(shí)際服務(wù)器應(yīng)用情況,將服務(wù)器規(guī)劃為N臺(tái)主服務(wù)器與一臺(tái)備用服務(wù)器,形成N+1的服務(wù)器熱備份形式,在服務(wù)器中均安裝 ServHA Cloud高可用軟件產(chǎn)品,ServHA Cloud高可用軟件產(chǎn)品負(fù)責(zé)實(shí)時(shí)檢測(cè)服務(wù)器故障并進(jìn)行應(yīng)用數(shù)據(jù)的實(shí)時(shí)同步,一旦運(yùn)行應(yīng)用的主服務(wù)器發(fā)生故障,規(guī)劃中的備用服務(wù)器將自動(dòng)接替故障主服務(wù)器的業(yè)務(wù)應(yīng)用,保證客戶核心業(yè)務(wù)7*24小時(shí)不間斷運(yùn)行,這一過(guò)程只需要幾秒鐘至幾分鐘,遠(yuǎn)遠(yuǎn)快于人工操作,保護(hù)了客戶的利益,如下圖所示:
此方案中,主服務(wù)器與備用服務(wù)器間的數(shù)據(jù)是實(shí)時(shí)同步的,沒(méi)有時(shí)間差,實(shí)現(xiàn)了業(yè)務(wù)數(shù)據(jù)的雙份存儲(chǔ)且應(yīng)用的高可用,業(yè)務(wù)數(shù)據(jù)的同步及存儲(chǔ)形式如下圖:
方案構(gòu)架
方案要求:
方案拓補(bǔ)如下:
此部署形式中,私網(wǎng)的心跳和數(shù)據(jù)同步鏈路作為主要的鏈路,連接公網(wǎng)交換機(jī)的鏈路作為備份冗余鏈路,如此部署可使數(shù)據(jù)同步不占用業(yè)務(wù)的帶寬,達(dá)到最好的效果。
故障處理
當(dāng)任意主服務(wù)器發(fā)生故障(如服務(wù)器宕機(jī)、掉電、網(wǎng)絡(luò)故障、應(yīng)用意外崩潰等),備用服務(wù)器將自動(dòng)接替服務(wù),保護(hù)業(yè)務(wù)不間斷運(yùn)行,同時(shí)利用虛擬IP技術(shù),用戶的訪問(wèn)IP也不會(huì)發(fā)生變化,待故障服務(wù)器修復(fù)并重新上線后,故障期間的產(chǎn)生的差異的業(yè)務(wù)數(shù)據(jù)將自動(dòng)回流至修復(fù)后的服務(wù)器并重新進(jìn)入實(shí)時(shí)數(shù)據(jù)同步狀態(tài),此時(shí)可根據(jù)集群配置自動(dòng)的將應(yīng)用切換回原主服務(wù)器或保持現(xiàn)狀不變。
方案優(yōu)點(diǎn)
集群中每個(gè)應(yīng)用的業(yè)務(wù)數(shù)據(jù)均是雙份存儲(chǔ),提高數(shù)據(jù)安全性
節(jié)省硬件投入,無(wú)需昂貴的磁盤陣列柜即可實(shí)現(xiàn)業(yè)務(wù)應(yīng)用高可用。
無(wú)縫的添加新的應(yīng)用、新的服務(wù)器節(jié)點(diǎn)。
備用服務(wù)器相對(duì)獨(dú)立,部署簡(jiǎn)單、明晰。
故障發(fā)生時(shí),切換速度快,極大的減少業(yè)務(wù)中斷時(shí)間。
管理員可進(jìn)行遠(yuǎn)程管理、監(jiān)控,在安全范圍內(nèi)用任意瀏覽器即可管理集群。
故障自動(dòng)恢復(fù)、自動(dòng)切換,實(shí)現(xiàn)無(wú)人值守。