備份:為了應對文件和數據丟失或損壞等可能發生的意外,將電子計算機存儲設備中的數據復制到磁帶等大容量存儲設備中。以便將單獨存儲的程序或文件的副本從原始文本中分離出來。(摘自《計算機科學》)
如果系統的硬件或存儲介質出現故障,備份工具可以幫助您保護數據免受意外損失。例如,您可以使用備份在硬盤上創建數據的副本,然後將數據存儲在其他存儲設備上。備份存儲媒體可以是邏輯驅動器(如硬盤)、獨立的存儲設備(如可移動磁盤)或由自動轉換器組織和控制的整個磁盤庫或磁帶庫。如果硬盤上的原始數據被意外刪除或覆蓋,或者由於硬盤故障而無法訪問數據,那麽您可以輕松地從歸檔副本中恢復數據。
備份分類
備份可分為系統備份和數據備份。
1.系統備份:指由於磁盤損壞或損毀、計算機病毒或人為誤刪等原因,導致用戶操作系統的系統文件丟失,導致計算機操作系統無法正常啟動。所以用系統備份來提前存儲操作系統,以備故障後的備份支持。
2.數據備份:指用戶存儲數據包,包括文件、數據庫和應用程序,用於數據恢復。
備份功能
備份的功能是為了備份支持和備份使用。
備份是容災的基礎,是指為了防止系統操作失誤或系統故障導致數據丟失,將數據集從應用主機的硬盤或陣列中全部或部分復制到其他存儲介質的過程。傳統的數據備份主要使用內置或外置磁帶機進行冷備份。但這種方法只能防止操作失誤等人為失誤,其恢復時間也很長。隨著技術的不斷發展和數據的大量增加,許多企業開始采用網絡備份。網絡備份壹般通過專業的數據存儲管理軟件結合相應的硬件和存儲設備來實現。
備份模式
常見的備份方法有:
定期用磁帶備份數據。
遠程磁帶庫和光盤庫備份。也就是將數據發送到遠程備份中心,制成完整的備份磁帶或光盤。?[1]?
遠程關鍵數據+磁帶備份。生產機器使用磁帶備份數據,將關鍵數據實時發送到備份機器。
遠程數據庫備份。在獨立於主數據庫所在的生產計算機的備份計算機上創建主數據庫的副本。
網絡數據鏡像。這樣就對生產系統的數據庫數據和要跟蹤的重要目標文件的更新進行了監控和跟蹤,並將更新日誌通過網絡實時傳輸到備份系統,備份系統根據日誌對磁盤進行更新。
遠程鏡像磁盤。鏡像磁盤通過高速光纖通道線路和磁盤控制技術擴展到遠離生產機器的地方。鏡像盤的數據和主盤的數據完全壹致,更新方式是同步或者異步。
數據備份必須考慮數據恢復的問題,包括采用?[2]多種災難預防措施,如雙機熱備、磁盤鏡像或容錯、備份磁帶遠程存儲、關鍵部件冗余等。這些措施可以在系統發生故障後恢復系統。但這些措施只能應對計算機單點故障,對區域性、毀滅性的災難束手無策,不具備災難恢復能力。
備份技術
系統災難恢復
(IDR =智能災難恢復)?
系統容災是指當系統崩潰時,只需很少的步驟就可以重建系統,包括上述系統補丁、應用軟件和數據。這樣可以提高恢復的準確性,縮短恢復時間,縮短業務中斷時間。
主要是?[3]災難恢復技術,有幾種恢復方式:
使用壹張通用光盤,所有系統都使用這張光盤。這種光盤可以同時啟動系統和網絡,然後備份服務器將磁帶庫(或虛擬磁帶庫)中備份的整個硬盤內容或第壹個主分區內容恢復到災難機上。這樣無論容災機有多少數據,都可以存儲在整個備份系統的備份設備中進行統壹管理,不需要經常刻光盤,也就是說光盤不需要經常更新。典型代表就是bakbone netvault vault災難恢復,右圖是bakbone netvault災難備份和恢復的數據流,所有系統使用統壹的光盤。
需要為每臺電腦單獨刻制壹張光盤,恢復時使用有針對性的光盤進行恢復。每臺機器都需要自己的光盤,而且需要定期更新。這種方法最大的缺點就是經常要刻盤,否則災難發生時如果沒有光盤或者光盤太長,會影響恢復的速度和恢復後的狀態。這項技術的典型代表是EMC網絡恢復管理器模塊。
恢復的時候需要借助網絡啟動,也就是需要有壹臺和引導機操作系統相同的主機,然後用備份的內容進行恢復。該技術的典型代表是Symantec NetBackup的裸機恢復模塊。
操作系統本身提供的災難恢復工具。對於大多數Unix小型機,都提供了系統備份工具。借助系統自帶的磁帶機和壹個簡單的命令,HP-UX可以使用make_recovery將整個根卷備份到服務器自帶的4mm磁帶上。恢復的時候,這個磁帶可以自己啟動系統,壹個命令就可以把整個根卷恢復到硬盤上。這種方式的優點是簡單經濟,特別是對於Unix系統,遠比備份軟件提供的BMR模塊方便、安全、經濟,因為備份軟件提供的BMR模塊往往需要同平臺的其他服務器才能啟動。
遠程數據復制
在另壹個地方實時制作可用的數據副本。該副本可以立即使用,無需數據恢復。數據復制最大的好處就是副本數據可以立即使用,沒有數據恢復時間,所以RTO非常好。同時因為是實時復制,RPO也很好,幾乎不會有數據丟失。缺點是成本遠高於數據備份,不僅數據復制系統昂貴,還需要其他硬盤存儲空間和主機系統,甚至還要另外建立壹個遠程機房,考慮網絡布線,會帶來很大的成本增加,所以數據復制的建設和維護成本遠遠大於數據備份。
目前,數據復制可以通過以下方式實現:
基於主機。基於主機的數據復制技術可以不考慮存儲系統的同構,只要主機是相同的操作系統。有支持異構主機之間數據復制的軟件,比如BakBone NetVault Replicator,可以支持異構服務器之間的數據復制,以及跨廣域網的遠程實時復制。缺點是占用了壹點主機資源。
基於存儲系統。使用存儲系統提供的數據復制軟件,復制的數據流可以在存儲系統之間傳遞,而與主機無關。這種方式的優點是數據復制不占用主機資源,缺點是容災中心的存儲系統和生產中心的存儲系統有嚴格的兼容性要求,壹般需要同壹廠家的存儲系統,限制了用戶容災中心存儲系統的選擇。
基於光纖開關。這項技術正在發展中,利用光纖交換機的新功能,或者利用管理軟件控制光纖交換機對存儲系統進行虛擬化,然後管理軟件對被管理的虛擬存儲池進行卷管理、卷復制、卷鏡像等技術,實現遠程數據復制。典型的有Storag、Falcon等。
基於應用程序的數據復制。這種技術有壹定的局限性,而且是針對特定的應用。主要使用數據庫本身提供的復制模塊,比如OracleDataGuard,Sybase復制等等。
數據保護技術
連續數據保護
CDP技術是目前最流行的數據保護技術。它可以捕獲文件級或塊級的所有數據寫入更改,並可以更詳細的粒度恢復備份對象,可以恢復到任何時間點。
CDP技術是壹項新技術,逐漸融入到許多傳統備份軟件中。比如BakBone NetVault Backup 8.0增加了TrueCDP模塊,Symantec Backup Exec12.5等等。包括EMC和Symantec在內的其他公司已經收購了壹些CDP軟件,並且正在與傳統備份軟件進行集成,他們都在進行集成。
CDP技術包括兩種類型:
近CDP就是我們所說的準CDP。它最大的特點是只能恢復指定時間點(FPIT)的部分數據,有點類似於存儲系統的邏輯快照,不能恢復固定時間點。賽門鐵克、CommVault、凱備份的CDP都屬於這種類型。
TrueCDP,我們稱之為TrueCDP,可以恢復指定時間段內的任意時間點(APIT),BakBone TrueCDP屬於TrueCDP類型。
應用現狀
如果災備方案分布在各個行業,大家會按照壹定的梯度使用。
首先采用系統容災(BMR裸機恢復),因為這種方案成本最低,在搭建數據備份系統時添加壹些模塊即可完成。沒有額外的存儲空間,沒有額外的存儲空間?[4]容災室,所以,幾乎所有有資格的用戶都可以實現。只有部分用戶使用操作系統提供的備份工具輔助,部分用戶使用備份軟件提供的災難模塊完成。這類用戶數量最多,分布在各個行業。BakBone的VaultDR被使用BakBone NetVault的備份軟件用戶廣泛使用。很多用戶非常喜歡BakBone VaultDR,無論操作系統類型如何,壹張標準光盤就可以適用於所有Intel x86服務器進行災難備份和恢復。
其次,建設容災系統的用戶,數據量大的高端企業壹般采用基於存儲的數據復制技術,如電信、金融行業。中低端用戶壹般使用基於主機的數據復制軟件,成本低,不需要嚴格的存儲系統采購。特別是BakBone的NetVault Replicator,不僅可以遠程復制數據,而且支持異構平臺,因此在國內外擁有廣泛的用戶,壹些政府部門、電力公司、證券部門、網站公司等。采用這種方式,並且大多在Windows和Linux平臺使用。雖然基於存儲交換層的虛擬存儲技術也有壹部分用戶,但由於該技術起步時間有限,技術成熟度有待進壹步驗證,很多用戶只是將其作為試點,並沒有大規模的推廣。對於基於應用的數據復制,壹些高端客戶正在采用,也有大量用戶。
至於CDP技術,才剛剛起步。這項技術滿足了許多關註災難恢復的用戶的需求,並且可以在RTO和RPO方面獲得高標準。同時,它可以再現任何版本歷史,這正在吸引越來越多用戶的關註。相信未來會有非常廣泛的用戶。BakBone的TrueCDP可以隨時恢復,是真正的CDP,會比其他準CDP產品有更大的優勢,會被更多關心容災的用戶選擇。
應用誤區
容災系統因為能帶來業務連續性而越來越受到重視,但在使用過程中也要記住壹些誤區。
沒有適合自己的選擇。沒有仔細分析和定義業務連續性需求,RTO和RPO沒有仔細研究,或者沒有去做,而是想追求最全面,可能會忽略最需要的建設,無法滿足自己的需求。
認為容災系統是萬能的,誇大了容災系統的功能,忽視了備份系統和高可用系統的建設。其實每個系統都有自己的功能,需要根據實際需要來搭建。
容災沒有壹步到位的建設,總想等實際成熟了再全面建設,甚至不先建設數據備份系統就開始建設容災系統。沒有備份系統的建設,就達不到數據安全的底線,關鍵時刻就會缺少壹份完整的數據,而花費大量的財力在容災系統的建設上,就得不償失了。
各種容災技術選擇不合理。例如,基於主機的復制軟件可以運行主機系統的資源,但選擇了基於存儲系統的設計,這就需要選擇相同類型的存儲設備,增加了整體成本。
對於BMR系統的災難備份,我們總是希望選擇備份軟件自帶的BMR模塊。其實備份軟件的BMR模塊對於Window和Linux來說是方便的,但是並不適合所有的Unix系統。在Unix系統備份方面,Unix的系統備份工具和磁帶機非常方便,壹個命令就可以完成系統備份,不依賴其他服務器,遠勝於壹些備份軟件的BMR模塊,不僅操作方便,而且降低了成本。
未來發展方向
未來的技術發展應該是多種技術並存,能滿足客戶需求的方式才能吸引客戶的註意力。
未來的發展方向之壹應該是基於主機的異構復制技術會有更廣闊的市場。因為大部分客戶都有異構的主機環境,並且支持異構環境下的數據復制技術,所以可以利用現有的環境,互相復制。對於不支持異構環境的復制軟件,需要購買相同的存儲或相同的操作系統主機進行數據復制,增加了災難恢復的整體成本。
未來的第二個發展是CDP技術。CDP結合了數據備份和數據復制的優點,既能保護實時數據,又能隨時恢復歷史數據,將具有更強大的生命力。隨著TrueCDP與傳統備份軟件的無縫連接,越來越多的用戶將采用TrueCDP構建容災系統。右圖是BakBone NetVault TureCDP備份系統的流行架構。
備用系統
備份系統的作用
很多系統管理員認為投資管理壹個備份任務是壹種浪費,相比原來復雜的備份系統,只有恢復時才起作用,而且通常會增加很多管理任務,對企業來說是很大的浪費。
這個問題是個大問題,直接關系到企業信息系統的投資回報率(ROI)。當IT系統的重要性非常高,企業的生活相關數據都在電腦系統裏,那麽數據的保護就非常重要,這是其壹。另外,備份系統的實施並不會帶來更多的管理任務,相反,會給系統管理員帶來很多維護上的便利,主要表現為:
備份的自動化降低了維護人員操作帶來的風險;
在線數據庫備份,確保24×7小時業務運營;
文件系統和數據庫數據的時間點恢復,版本歷史管理;
磁帶克隆可以降低磁帶出錯概率,實現容災和異地存儲;
網絡備份、無局域網和無服務器備份方式;
從系統災難中快速恢復。
因此,如果企業必須實現上述功能,而企業沒有實施備份系統,如果人力和設備的投入大於實施備份系統的投入,那麽備份系統的投入是可以接受的。
備份系統的功能
用戶只需要簡單的備份,沒有那麽復雜。用戶在備份系統裏買了很多沒用的先進技術,沒必要在系統裏實現太多復雜的功能。
備份系統的功能是備份技術發展到壹定階段的產物,先進技術的出現也是由於用戶系統中的需求。當IT系統發展到壹定程度,用戶對IT系統的依賴性增加,IT系統的數據量越來越大,對系統備份的要求也就越來越高。但是壹個好的備份系統應該具有以下特征:
備份系統可以根據應用系統的需要方便地擴展;
滿足未來數據量和應用系統升級帶來的備份系統壓力;
在備份系統方面,尤其是備份軟件的升級能力。
總的來說,備份技術經歷了幾個發展階段,從傳統的磁帶備份到網絡備份,從SCSI?無局域網備份到動態共享無局域網備份的SAN結構,直到無服務器備份的出現。可以預見,未來的備份產品將有以下趨勢:
備份光盤
情況
隨著SATA磁盤價格的進壹步下降,磁盤的備份優勢逐漸體現。EMC推出了使用磁盤作為虛擬磁帶庫的產品,在功能上可以替代磁帶庫的功能。筆者認為,這款產品的批量上市,會在壹定程度上引發備份硬件設備的升級。
ISCSI技術
該技術可以利用現有的TCP/IP網絡進行數據傳輸,用戶可以方便地實現數據的遠程遠程保護。市場上已經出現了很多這樣的產品,相信隨著產品的成熟,很多遠程備份和容災方案都會選擇這種技術。
NDMP議定書
作為標準,NDMP(網絡數據管理協議)已經發展到第4版,支持該協議的產品可以輕松實現NAS服務器數據的快速備份和恢復。對於大量的小文件,這種技術有獨特的優勢。
備份技術
很多磁盤陣列都提供了快照功能,對於磁盤陣列上的快照,我們可以充分利用快照技術對數據進行無服務器備份,這對於大型企業級系統來說意義重大,大大減少了備份時對生產系統的資源占用,並且可以非常快速的恢復。
實現備份介質的生命周期管理
通常,每盤磁帶都有壹定的使用次數。因此,對於磁帶備份系統來說,在使用壹定次數後,磁帶應該被丟棄,不能用於備份關鍵數據。
維持
人們投資於全自動備份系統,以減少維護工作量。只要制度落實,維護工作就可以放松。壹個星期或者壹個月檢查壹下備份狀態就可以了。
用戶實現備份系統後,備份系統的維護還是很重要的。主要由以下因素決定。
因為很多單位的很多IT系統都有很多主機,很多應用系統,每個應用系統都有相應的管理維護人員,備份就是對各種應用數據備份任務的集中管理。因此,對於具有復雜應用系統的用戶,可以設置備份系統管理員或存儲備份工程師來維護整體備份系統。
隨著數據和應用系統的增加,備份策略應該隨著時間的遷移而優化。
備份系統涉及到很多技術,如操作系統、數據庫、存儲、磁帶庫等。因此,建議備份系統管理員對各種知識有壹定的了解,除了備份系統知識外,還要參加操作系統、數據庫等產品的專業培訓,以保證應用系統在災難發生時能盡快恢復數據。
如果關鍵數據庫的日常備份失敗,可能會導致數據庫暫停。比如,對於?[5]對於[5]Oracle數據庫,如果數據庫的“存檔日誌”沒有及時備份,整個數據庫都會停止。
如果磁帶庫備份系統中有“克隆”功能,就需要每天把“克隆”的介質拿出來,存放在不同的地方,方便災難恢復。
產品
在選擇產品時,備份磁帶庫要盡可能大,磁帶機要盡可能快,盡可能使用最先進的技術。
在產品選擇的過程中,性價比是最重要的指標之壹,但絕不是全部。建議用戶在選擇產品時考慮以下因素:
類型、數量、備份策略(完整備份、增量備份等。)和關鍵數據的保留時間決定了磁帶庫的總容量。
磁帶機的最小數量由備份時間窗口和備份數據量的峰值數據量決定;
應用程序系統的類型和數據類型決定了用於備份的技術。
如果使用NAS設備進行備份,盡量選擇NDMP備份;SAN架構備份應盡可能由磁帶機動態共享;磁盤陣列提供鏡像或快照功能,可以使用快照備份技術。
在磁帶機技術的選擇上,建議選擇更通用的設備。對於此磁帶機,操作系統和備份軟件與之兼容。
由於磁帶機是機械設備,故障率高於磁盤、光盤等設備,所以在配置磁帶機時盡量保持冗余。SATA磁盤技術發展突飛猛進,磁盤備份技術成為發展方向。
對於硬件設備,考慮備件的提供和提供商的服務水平,對於備份軟件,提供專業服務和技術支持也是需要考慮的重要因素。
備份軟件應該廣泛兼容。
數據容災
企業關鍵數據的丟失會中斷企業的正常業務運營,造成巨大的經濟損失。為了保護數據,企業需要備份災難恢復系統。然而,許多企業認為建立備份系統後就可以高枕無憂了。事實上,他們需要建立壹個災難恢復系統。數據容災與數據備份的聯系主要體現在以下幾個方面:
數據備份基礎
數據備份是數據高可用性的最後壹道防線,其目的是在系統數據崩潰時快速恢復數據。雖然也是容災方案,但是容災能力非常有限,因為傳統的備份主要是通過內置或者外置數據的磁帶機進行?【6】冷備份,備份磁帶也在機房統壹管理。壹旦整個機房發生災難,比如火災、被盜、地震,這些備份磁帶就會被破壞,存儲的磁帶備份就沒有任何容災功能。
容災和備份
真正的數據容災是為了避免傳統冷備份固有的缺點,在災難發生時能夠全面及時的恢復整個系統。容災能力根據其容災能力可以分為幾個等級。例如,國際標準SHARE 78定義的容災系統有七個級別:從最簡單的本地磁帶備份,到將備份的磁帶異地存儲,再到建立應用系統實時切換的遠程備份系統,恢復時間也可以從幾天到幾小時,到幾分鐘、幾秒或零數據丟失。
無論采用哪種容災方案,數據備份仍然是最基本的。沒有備份數據,任何災難恢復方案都沒有實際意義。但是光有備份是不夠的,容災也是必不可少的。容災對於IT來說就是提供壹個可以預防各種災難的計算機信息系統。技術上,衡量容災系統的指標主要有兩個:RPO(恢復點對象)和RTO(恢復時間對象),其中RPO代表災難發生時允許丟失的數據量;RTO表示系統恢復的時間。
容災不僅僅是技術。
容災是壹個項目,不僅僅是技術。許多客戶仍然關註災難恢復技術,但不清楚災難恢復的流程、規範和具體措施。我從來沒有評估過容災方案的可行性,以為只要建立了容災方案就可以高枕無憂了。其實這是很有風險的。尤其是壹些中小企業,認為自己的企業壹年到頭花了大量的人力財力進行數據備份和災難恢復,結果幾年都沒有發生大的災難,因此放松了警惕。但是壹旦災難發生,後悔都來不及了!在這方面,國外的跨國公司做得非常好。雖然這幾年沒有發生大的災難,備份了那麽多磁帶幾乎沒有用,但是他們壹如既往的非常認真的做好了每壹步,基本上每個月都會評估當前災難恢復計劃的可行性,進行實地演練。?[7]?
數據容災級別
設計壹個?[4]容災備份系統需要考慮很多因素,如備份/恢復數據的大小、應用數據中心與備份數據中心的距離和數據傳輸方式、發生災難時所需的恢復速度、備份中心的管理和投資等。根據這些因素和不同的應用,常見的災難恢復備份級別如下:
本地冷備份
這個級別的容災備份其實就是上面說的數據備份。它的容災能力最弱,只在本地備份數據,備份的數據磁帶只在本地保存,不送到外地。
在這種災難恢復方案中,最常用的設備是什麽?[8]磁帶機當然可以根據實際需要手動加載或者自動加載。前者主要適用於存儲數據容量較小的中小型企業。
參考數據
1.基於NBU備份系統的磁帶庫優化擴容方案研究。中國知網[引用日期:2017-04-02]
2.雙機熱備系統的技術研究和具體實現。中國知網[引用日期2017-04-02]
3.雲計算在電力系統數據容災業務中的應用研究。中國知網[引用日期2017-04-02]
4.容災備份系統中同步策略的研究及效率分析。中國知網[引用日期:2017-04-02]
5.Oracle數據庫優化。中國知網[引用日期2017-04-02]
6.前兆管理系統數據庫冷備份和恢復方法的實現。中國知網[引用日期2017-04-02]
7.容災理論及關鍵技術分析。中國知網[引用日期2017-04-02]
8.磁帶機控制程序的研究與實現。中國知網[引用日期2017-04-02]
本文引自北京大學姚遠教授,來源於百度百科。
附加鏈接:網頁鏈接