建設災備中心保障企業信息化探討

時間:2022-01-05 16:15:04

導語:建設災備中心保障企業信息化探討一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

建設災備中心保障企業信息化探討

摘要:隨著云計算、大數據、人工智能等新一代信息技術快速發展,給企業信息化發展插上了翅膀。我們正處在一個信息數據爆炸性增長的大數據時代,數據的存儲方式由分散在各個服務器硬盤轉變為集中的存儲資源池。各種信息數據給企業帶來不菲價值的同時,信息數據缺失帶來的影響也隨之而來,容災備份突顯出其重要性。該文在容災備份概述、容災級別和容災備份技術介紹的基礎上,描述災備中心系統架構和建設策略,指出應根據實際情況針對性地建設災備中心,最大程度的保障企業信息化

關鍵詞:容災備份;災備中心;建設策略

現在是信息化時代,信息數據成為各行各業的基礎和命脈,信息數據的缺失將影響業務系統的正常運行,導致企業的生產經營受到重大影響。傳統的數據備份模式將數據備份至本地存儲資源池,避免個人因素、服務器硬盤故障、操作系統中毒等原因造成的數據缺失,但對于自然災害造成的損毀則無法挽救。當下虛擬化和云計算的業務系統有更高的響應要求,傳統的數據備份模式無法滿足新時代的RTO和RPO需求。從戰略角度研究如何建設災備中心保障企業信息化顯得尤為重要。

1容災備份概述

1.1容災備份的含義

容災指在物理上間隔開的兩處或多處場所,各自建設一套完整的業務系統。業務系統可以切換至任意一處場所,各處業務系統互相檢測對方運行狀態。當自然災害導致某一處場所業務系統無法運行時,另外一處場所業務系統可以及時接管,保證業務系統穩定、安全運行。單從目的出發,所有為了保障業務系統可用性做出的工作都稱之為容災。備份指對信息數據、操作系統的額外復制。避免個人因素、服務器硬盤故障、操作系統中毒等原因造成的數據缺失,從服務器硬盤、存儲資源池中手工拷貝或使用備份軟件將數據復制到其他存儲介質的過程。完整備份、增量備份、差異備份都是備份的不同模式。備份和容災是存儲領域兩個極其重要的部分,備份是信息數據可用性的最后一道防線,是容災的根本和基礎;容災是達成應用高可用性的手段之一[1]。

1.2容災級別

根據應對突發災難時,容災所給出的不同程度的應急解決方案,可以區分為數據級容災、應用級容災和業務級容災。1.2.1數據級容災數據級容災,顧名思義就是針對數據本身層面的容災。當發生災難時,數據容災可以及時恢復信息數據,保證數據完整性。但數據容災僅僅保護信息數據,如果災難發生時業務系統也遭受損壞,恢復的信息數據也無法使用。1.2.2應用級容災應用級容災在數據級容災的基礎上,對業務系統也進行容災。在災備環境中搭建一套同樣的業務系統,保持與運行的業務系統數據同步傳輸。當發生災難時,信息數據和業務系統同時快速切換至災備環境的業務系統,保證業務系統運行連續性。應用級容災可以讓業務系統隨時切換運行場所,保證業務系統始終都在線,不受外界環境的變化影響。1.2.3業務級容災除了保證信息數據、業務系統在災備環境可用之外,還要保障整個企業的業務仍對外服務,這里面就包含了業務服務可用,管理部門可用、業務生產部門可用、對外服務部門可用等,這是最終層次的容災[2]。信息化時代高速發展,對業務系統提出了更高的“四不原則”:業務不停、網絡不斷、系統不癱、數據不丟[3],這一核心理念在業務系統安全生產過程中起到了非常重要的指導作用。

2容災備份的技術

2.1數據備份技術

數據備份是容災備份的基礎工作,為了防止個人因素、硬盤故障、系統中毒等原因造成的數據缺失,從硬盤、存儲資源池將數據復制到其他存儲介質的過程。傳統的數據備份通常采用磁帶庫進行冷備份,隨著網絡帶寬發展,數據備份采用了數據備份管理軟件結合備份存儲設備實時在線運行。

2.2遠程復制技術

通過遠程復制技術,來實現數據中心和災備中心之間的數據傳輸,保證數據傳輸的一致性、可靠性。將數據中心產生的數據源源不斷的復制到災備中心,保證災難發生時業務系統恢復的數據損失最小化。

2.3實時檢測技術

當災難發生,如何盡早發現業務系統不可用,如何盡快將業務系統切換到災備環境,都可以讓災難帶來的損失降到最低。除了人工發現災難到來時手動切換業務系統,業務系統如何能自動檢測異常情況發生,自動切換成為關鍵。目前檢測技術一般采用心跳技術,即在數據中心和容災中心設定定期廣播機制,數據中心每隔一段時間向容災中心發送信號,表示自己處于正常運行狀態。當容災中心在設定的最大容忍時間內都沒有收到信號時,容災中心便認為數據中心出現異常,采取接管行動。

3災備中心的系統架構

容災中心的系統架構規劃,結合地域、功能的不同劃分為:本地備份、異地熱備、異地互備。

3.1本地備份

數據僅僅在本地存儲設備做了備份保存,并沒有在異地單獨建設一個災備中心,如果遇到災難情況比較嚴重,本地備份難以實現數據恢復。

3.2異地熱備

在異地獨立建設一個災備中心,災備中心與數據中心數據傳輸通過網絡專線進行。在日常業務系統正常運行情況下,災備中心僅僅只是備份數據,不涉及業務系統運行。如果數據中心通信發生異常,災備中心及時響應并接管業務系統運行,保證業務系統正常運行的連續性[4]。

3.3異地互備

在與數據中心有一定物理距離的異地建設另外一個數據中心。業務系統在日常情況下隨機運行在一個數據中心,另外一個靜默同步數據。在遇到突發災難時,兩個數據中心可以根據自身情況相互接管業務系統。

4災備中心的建設策略

災備中心的建設策略,應全盤考慮企業成長結合不同時期的業務需求。創業伊始,企業的業務系統還剛剛起步,完全可以依照數據級容災的要求對關鍵信息數據進行備份;到了成長階段,企業的發展伴依托業務系統信息化快速成長,這個時候需要選擇應用級容災來保障企業成長需要;來到穩定發展階段,企業經過高速的發展,業務系統伴隨著企業規模不斷擴展。這個時候就可以考慮選擇同城雙活或者兩地三中心的容災備份方案,確保企業發展的信息數據不丟失,業務系統安全、穩定地運行。在當今以服務為導向和以客戶為中心的業務環境下,保障災備中心的正常運行對數據中心具有重大意義[5]。

4.1本地數據備份

當數據中心正常運行時,將業務系統不間斷運行的過程中產生的數據實時或定期備份到除本地存儲之外的備份存儲。如果硬件設備允許,可以同時歸檔到磁帶庫保存。

4.2雙活數據中心

在數據中心之外,再獨立建設一個災備中心,災備中心與數據中心通過網絡通信進行數據備份傳輸。在業務系統正常運行情況下,災備中心只備份數據,不涉及業務系統運行,但可以對外提供信息數據讀取服務。如果數據中心通信發生異常,災備中心及時響應并接管業務系統運行,保證業務系統正常運行的連續性。

4.3兩地三中心

在雙活業務中心的架構基礎之上,在異地建設一個獨立的災備中心。不同于其他容災方案,兩地三中心的容災依靠資源組的狀態來判斷是否需要進行業務接管切換。資源組的狀態一共有三種,分別為online、offline、fault。在online或者offline的狀態下,資源組都能夠按照既定的方案運行腳本和程序,保障業務系統始終在線運行。數據中心正常運行時,其資源組的狀態顯示為online,其他兩個災備中心的資源組狀態為offline。當數據中心的資源組出現fault狀態時,資源組判斷災難已經發生,同時進行業務系統切換,從而保障了業務的連續性。

4.4災備中心的容災指標

在大數據時代,企業對業務的連續性有嚴苛的要求,但有些天災人禍和人為故障難以避免,一旦發生意外就需要啟用災備方案,保障業務系統的連續性。RPO和RTO可以很好地反映出企業系統的容災性能如何。這兩個指標值的高低,直接反映了當前系統數據在災難恢復方面的能力。4.4.1RPO(RecoveryPointObject)恢復點目標當災難發生時,備份的數據能夠恢復到具體哪個時間節點,在這個時間節點之后到災難發生時的數據則丟失了,體現業務系統能承受的最大數據缺失時間段。比如定時備份在每天0點進行,設置的業務系統RPO為12小時。如果早上8點發生災難,最大數據缺失時間就是8個小時,沒有超過RPO規定時間并無大礙;如果晚上8點發生災難,最大數據缺失時間就是20個小時,大大超過RPO規定時間,那么會導致業務系統受到影響以致造成損失。4.4.2RTO(RecoveryTimeObjective)恢復時間目標當災難發生時,業務系統容忍停止運行的最長時間,也就是災難發生到業務系統恢復運行功能所需要的最短時間。如果業務系統設定災難發生的6個小時內必須恢復,那么RTO就是6小時。這意味著能容忍業務系統停止運行的時間為6小時,即雖然業務系統在這6小時內不能運行,但業務可以正常維持進行。如果業務系統在6小時后仍不能恢復運行,那么業務可能會遭受無法彌補的損失。

4.5完備的災備中心設計

首先區分同城災備中心和異地災備中心的功能和差異,數據中心與同城災備中心的距離比較近,通信線路質量較好,比較容易實現數據的快速恢復,保證數據完整性和數據零丟失。而異地災備中心與數據中心之間的距離較遠,異地災備中心不僅可以防范區域性災難時夠保障關鍵業務的安全性,做到數據不丟失,還能夠防范戰爭、地震、水災等風險。而兩地三中心比同城災備中心多了一個異地數據中心。這個異地數據中心主要用于規避大自然災害發生時,異地的數據中心能夠立即啟動,保障業務和數據最大限度不受影響,仍能夠正常運行[6]。其次建設前期應該特別關注,業務系統對業務的重要性決定了容災級別是數據級還是應用級;業務系統的硬件性能高低決定了災備中心的設備選型;業務對RTO/RPO的要求決定了容災備份是同步備份數據還是異步備份數據;生產存儲的數據大小和增長快慢,決定了災備中心容災存儲的選擇。

5結束語

當前自然災害頻發、網絡攻擊越來越嚴重的背景下,盡快建設災備中心的任務迫在眉睫。如何建設災備中心是一項縝密細致的工程,我們應該從業務系統建設情況出發,結合企業自身發展情況進行科學有效的規劃和建設,保證災備管理程序嚴格執行,讓災備中心真正地發揮作用,為信息化領域的關鍵業務和業務系統安全保駕護航。

參考文獻:

[1]林小村.馬玉林.翁小云.數據中心建設與運行管理[M].北京:科學出版社,2010.

[2]張冬.大話存儲[M].北京:清華大學出版社,2008.

[3]趙晟華.數據中心運維服務管理與呼叫中心整合的有關技術分析[J].中國信息化,2020(7):58-59.

[4]狄廣義.數據中心災備系統建設研究[J].通訊世界,2017(23):47-49.

[5]顧大偉,郭建兵,黃偉.數據中心建設與管理指南[M].北京:電子工業出版社,2010.

[6]吳瑩.兩地三中心容災備份系統建設及成效[J].金融科技時代,2016,24(5):23-27.

作者:許上鑒 單位:上海核工程研究設計院有限公司