一、現(xiàn)有硬件及應用環(huán)境(已具備,本次無需采購)
1.服務器兩臺(安裝操作系統(tǒng)且用于運行客戶的應用服務);
2.服務器的操作系統(tǒng):Windows NT Server;
3.應用服務:Interlib(圖創(chuàng)圖書館集群化管理系統(tǒng))
二、熱備方案應達到的目的
本項目為解決基于存儲共享或者雙機鏡像的熱備軟件系統(tǒng)中存在的共享存儲設(shè)備單點故障問題,可建立異地存儲(容災)子系統(tǒng),避免今后基礎(chǔ)設(shè)施的重建,為下一步整合和擴大圖書館資源建設(shè)和服務提供保障。
通過搭建純軟雙機的系統(tǒng)高可用性解決方案在兩臺服務器運行Oracle和Interlib。使用兩臺服務器構(gòu)造高可用系統(tǒng),實現(xiàn)Oracle和Interlib應用服務7*24運行,同時服務器之間數(shù)據(jù)實時鏡像,保證數(shù)據(jù)的高可用性。
1.兩臺服務器,每臺服務器都裝上Oracle數(shù)據(jù)庫,Interlib應用服務,并能夠單獨運行。
2.系統(tǒng)中相關(guān)的數(shù)據(jù)都存放在Oracle數(shù)據(jù)庫中。
3. Interlib應用服務對外提供服務,對應于Tomcat配置多個活動IP。(注意的是配置的活動IP與服務器上的本地IP要在不同的網(wǎng)段上)
4.服務器之間用RS232串口或TCP/IP socket作為心跳線,傳輸熱備軟件的心跳信息。(建議用戶至少建立兩條心跳線,避免服務器間通信的單點故障)
5.服務器之間通過基于TCP/IP協(xié)議的網(wǎng)絡(luò)進行數(shù)據(jù)實時復制。
熱備軟件將分別安裝在兩臺服務器上,其中一臺作為Interlib(圖書館自動化集群管理系統(tǒng))和Oracle數(shù)據(jù)庫兩個應用服務的主服務器,另外一臺作 為Interlib和Oracle數(shù)據(jù)庫的備服務器,雙機軟件在這兩臺服務器之間做虛擬公用ip以提供對外服務,正常情況下一臺服務器對外提供服務 (Oracle作為后臺數(shù)據(jù)庫),同時其服務變動的數(shù)據(jù)會實時傳遞到另外一臺主機上進行備份。一旦某個服務器上的服務出現(xiàn)故障,另外一臺服務器便在不影響 自身的應用服務的情況下接管其任務,直到故障服務器恢復為止。
三、熱備軟件技術(shù)和方案要求
1.熱備軟件工作模式
軟件需支持Active/Standby和Active/Active兩種模式。
2.保證業(yè)務的持續(xù)不間斷
正常情況下應用服務(Interlib圖書館集群化管理系統(tǒng))在主服務器上運行,熱備軟件將主服務器的數(shù)據(jù)實時鏡像到備服務器上,并實時監(jiān)控應用、網(wǎng)絡(luò)等 狀態(tài)。當主服務器發(fā)生故障時,熱備軟件會迅速地將應用服務以及相關(guān)資源切換到備服務器上,使用備服務器上的鏡像數(shù)據(jù)繼續(xù)運行應用服務,并持續(xù)對外提供服 務。
3.在線備份數(shù)據(jù)或維護
當需要對備機上復制的數(shù)據(jù)進行備份、查看的操作,不希望新的數(shù)據(jù)寫入時,可以使備機暫停寫入,暫停后數(shù)據(jù)仍將發(fā)送到備機,備機將暫停后的數(shù)據(jù)緩存起來。備 機完成數(shù)據(jù)操作后,再將緩存的數(shù)據(jù)寫入到備機磁盤中,恢復正常操作狀態(tài),熱備軟件 允許對Active主機復制的數(shù)據(jù)暫停發(fā)送,暫停后變化的數(shù)據(jù)仍將被截獲,變化的數(shù)據(jù)將被存入source端pagefile中,等待傳輸暫停恢復后發(fā) 送。
4.智能的故障處理恢復
在網(wǎng)絡(luò)故障、傳輸暫停等情況下,數(shù)據(jù)無法發(fā)送時,服務可將數(shù)據(jù)暫存在pagefile中,當可以發(fā)送后繼續(xù)進行發(fā)送,保證數(shù)據(jù)不會丟失。pagefile 的大小可以自行設(shè)定。當網(wǎng)絡(luò)發(fā)生故障后,熱備軟件的數(shù)據(jù)復制不會停止,而是將復制的數(shù)據(jù)放入pagefile中,當網(wǎng)絡(luò)恢復后將自動地將pagefile 中的數(shù)據(jù)發(fā)送到目標機,而不需要重新進行同步,減少網(wǎng)絡(luò)和CPU的負載。
5.增強數(shù)據(jù)安全策略
熱備軟件提供全面的數(shù)據(jù)安全策略,對數(shù)據(jù)的可用狀態(tài)進行監(jiān)控,充分保證切換后的數(shù)據(jù)狀態(tài)是一致有效的。 熱備軟件完整的高可用性保護策略,在主機發(fā)生故障時,可以及時自動的將應用服務切換到備機,確保業(yè)務迅速恢復。
6.數(shù)據(jù)冗余保護
熱備軟件監(jiān)控在主機上的應用。一旦捕獲到應用變動的數(shù)據(jù),便立即把該數(shù)據(jù)鏡像到另外的主機中,從而保證兩臺主機數(shù)據(jù)的一致性,實現(xiàn)冗余保護。
7.消除備份窗口
通過備機寫入暫停或主機傳輸暫停,可以在確保主機應用在線持續(xù)運行的情況下,通過備機將數(shù)據(jù)備份到帶庫上。即保證了業(yè)務的持續(xù)運行,性能不受影響,又可以 對數(shù)據(jù)進行更多方式,更加靈活的備份保護。同時備份操作的作業(yè)時間也有了更大的靈活性,不必等到晚上或是周末再進行。
8.降低管理和維護成本
數(shù)據(jù)的實時鏡像和保證業(yè)務7*24提供服務,是熱備軟件自動完成,不需要人工進行干預。
9.實時對磁盤空間監(jiān)控
熱備軟件提供磁盤空間監(jiān)控功能,當磁盤的可用空間低于設(shè)定值時,將通過郵件、在線消息進行報警。
10.服務器錯誤郵件實時信息通知
熱備軟件支持郵件信息通知,當發(fā)生異常情況時,系統(tǒng)將自動地發(fā)送信息給設(shè)定的郵箱,幫助管理員及時了解系統(tǒng)運行狀態(tài)。
11.與Interlib集群管理系統(tǒng)短信平臺無縫對接
熱備軟件除了支持郵件信息通知外,還能與Interlib的短信平臺進行對接,當發(fā)生異常情況時,系統(tǒng)自動根據(jù)異常錯誤級別自動發(fā)送給指定的級別的管理操作人員,幫助用戶實時了解服務器運行情況。
12.按需復制性能資源最佳效果
熱備軟件支持復制數(shù)據(jù)集的定義,用戶可以選擇定制需要復制的目錄、文件。熱備軟件的數(shù)據(jù)鏡像是基于文件系統(tǒng)之上的,僅僅復制文件變化的部分。熱備軟件通過 自身的驅(qū)動程序來監(jiān)控用戶指定數(shù)據(jù)集,獲取變化內(nèi)容進行傳輸處理。以這種以字節(jié)為單位的按需復制,充分保證系統(tǒng)性能和效率的最佳化。
13.自動的應用高可用性保護
熱備軟件中每個被保護的應用可以建立8個活動IP,客戶端可以通過活動IP訪問應用服務,另外熱備軟件中每個被保護的應用都可以建立多個主機別名,客戶端可以通過別名訪問應用服務。
14.支持應用進程的監(jiān)控
熱備軟件可以監(jiān)控標準的Windows服務或是Linux平臺的應用,同時支持以自定義方式對用戶自己的應用進程進行監(jiān)控。
15.實時網(wǎng)卡、活動IP的監(jiān)控
熱備軟件將對主機的網(wǎng)卡、活動IP的狀態(tài)進行監(jiān)控,當發(fā)生故障時通過在線消息等進行通知。
16.支持多條心跳
熱備軟件支持Socket和RS232兩種類型的心跳,并支持心跳冗余,最多允許三條心跳。當配置遠距離的高可用性系統(tǒng)時,使用網(wǎng)卡類型的心跳。
|