【作者】張鵬,某金融科技公司高級技術(shù)主管 企業(yè)IT系統(tǒng)里最核心的就是數(shù)據(jù),如何保證數(shù)據(jù)安全是每個企業(yè)重點關(guān)注的領(lǐng)域。數(shù)據(jù)安全是一個比較大的技術(shù)范疇,本文僅針對數(shù)據(jù)備份,談?wù)勅绾卧谄髽I(yè)中做到合理的數(shù)據(jù)備份和有效的數(shù)據(jù)恢復。 1. 備份相關(guān)的基礎(chǔ)知識1.1. 什么備份首先先了解一下什么是數(shù)據(jù)備份,數(shù)據(jù)備份顧名思義,就是將數(shù)據(jù)以某種方式加以保留,以便在系統(tǒng)遭受破壞或其他特定情況下,重新加以利用的一個過程。在日常生活中,我們經(jīng)常需要為自己家的房門多配幾把鑰匙,為自己的愛車準備一個備胎,這些都是備份思想的體現(xiàn)。 數(shù)據(jù)備份作為存儲領(lǐng)域的一個重要組成部分,其在存儲系統(tǒng)中的地位和作用都是不容忽視的。對一個完整的IT系統(tǒng)而言,備份工作是其中必不可少的組成部分。其意義不僅在于防范意外事件的破壞,而且還是歷史數(shù)據(jù)保存歸檔的最佳方式。換言之,即便系統(tǒng)正常工作,沒有任何數(shù)據(jù)丟失或破壞發(fā)生,備份工作仍然具有非常大的意義,為我們進行歷史數(shù)據(jù)查詢、統(tǒng)計和分析,以及重要信息歸檔保存提供了可能。 簡單的說,一份數(shù)據(jù)備份的作用,不僅僅像房門的備用鑰匙一樣,當原來的鑰匙丟失或損壞了,才能派上用場。有時候,數(shù)據(jù)備份的作用,更像是我們?yōu)榱肆糇∶篮脮r光而拍攝的照片,把暫時的狀態(tài)永久的保存了下來,供我們分析和研究。當然我們不可能憑借一張兒時的照片就回到從前,在這一點上,數(shù)據(jù)備份就更顯神奇,一個存儲系統(tǒng)乃至整個網(wǎng)絡(luò)系統(tǒng),完全可以回到過去的某個時間狀態(tài),或者重新“克隆”一個指定時間狀態(tài)的系統(tǒng),只要在這個時間點上,我們有一個完整的系統(tǒng)數(shù)據(jù)備份。 還有一個需要澄清的問題,數(shù)據(jù)備份更多的是指數(shù)據(jù)從在線狀態(tài),剝離到離線狀態(tài)的過程,這與服務(wù)器高可用集群技術(shù)以及遠程災(zāi)備技術(shù),在本質(zhì)上有所區(qū)別。雖然從目的上講,這些技術(shù)都是為了消除或減弱意外事件給系統(tǒng)帶來的影響,但是,由于其側(cè)重的方向不同,實現(xiàn)的手段和產(chǎn)生的效果也不盡相同。集群和災(zāi)備技術(shù)的目的,是為了保證業(yè)務(wù)的連續(xù)性,也就是說,當意外發(fā)生時,系統(tǒng)所提供的服務(wù)和功能不會因此而間斷,能夠重續(xù)運行。對數(shù)據(jù)而言,集群和災(zāi)備技術(shù)是保護系統(tǒng)的在線狀態(tài),保證數(shù)據(jù)可以隨時被訪問。而相對來說,備份技術(shù)的目的,是將整個系統(tǒng)的數(shù)據(jù)或狀態(tài)保存下來,這種方式不僅可以挽回硬件設(shè)備壞損帶來的損失,也可以挽回邏輯錯誤和人為惡意破壞的損失。 然而,一般來說,數(shù)據(jù)備份技術(shù)并不保證系統(tǒng)的實時可用性。也就是說,一旦意外發(fā)生,備份技術(shù)只保證數(shù)據(jù)可以恢復,但是恢復過程需要一定的時間,在此期間,系統(tǒng)是不可用的。在具有一定規(guī)模的系統(tǒng)中,備份技術(shù)、集群技術(shù)和災(zāi)備技術(shù)互相不可替代,并且穩(wěn)定和諧的配合工作,共同保證著系統(tǒng)的正常運轉(zhuǎn)。 1.2. 手工備份和自動化備份相比于系統(tǒng)、數(shù)據(jù)庫管理人員手工備份,自動備份軟件有如下的優(yōu)勢: 穩(wěn)定性 備份的主要作用是為系統(tǒng)提供一個數(shù)據(jù)保護的方法,于是備份本身的穩(wěn)定性和可靠性就變成了最重要的一個方面。相比與手工備份,自動備份軟件更能保證備份的穩(wěn)定可靠,能提供方法確保不會在恢復時才發(fā)現(xiàn)備份是不成功的。 全面性 在復雜的計算機網(wǎng)絡(luò)環(huán)境中,可能會包括了各種操作平臺,如各種廠家的UNIX、Linux、Windows等,并安裝了各種應(yīng)用系統(tǒng),如數(shù)據(jù)庫、文件系統(tǒng)等。備份軟件可以全面支持這些平臺、軟件。 自動化 很多公司由于工作性質(zhì),對何時備份、用多長時間備份都有一定的限制。在下班時間系統(tǒng)負荷輕,適于備份??墒沁@會增加系統(tǒng)管理員的負擔,由于精神狀態(tài)等原因,還會給備份安全帶來潛在的隱患。自動備份軟件能提供定時的自動備份,并利用磁帶庫等技術(shù)進行自動換帶。在自動備份過程中,還有日志記錄功能,并在出現(xiàn)異常情況時自動報警。 高性能 隨著業(yè)務(wù)的不斷發(fā)展,數(shù)據(jù)越來越多,更新越來越快,在休息時間來不及備份如此多的內(nèi)容,在工作時間備份又會影響系統(tǒng)性能。備份軟件在備份時,可以盡量考慮到提高數(shù)據(jù)備份的速度,如利用多個磁帶機并行操作的方法、利用合成備份的方法等等。 操作簡單,集中管理 備份軟件提供集中管理功能,能夠?qū)μ貏e重要數(shù)據(jù)做多份拷貝,并能記錄跟蹤每次備份的不同版本,這樣就可以按照需要恢復不同的數(shù)據(jù)。數(shù)據(jù)備份應(yīng)用于不同領(lǐng)域,進行數(shù)據(jù)備份的操作人員也處于不同的層次。備份軟件提供了一個直觀的、操作簡單的圖形化用戶界面,縮短操作人員的學習時間,減輕操作人員的工作壓力,使備份、恢復工作得以輕松地設(shè)置和完成。 實時性 有些關(guān)鍵性的任務(wù)是要24小時不停機運行的,在備份的時候,有一些文件可能仍然處于打開的狀態(tài)。那么在進行備份的時候,要采取措施,實時地查看文件大小、進行事務(wù)跟蹤,以保證正確地備份系統(tǒng)中的所有文件。而這些僅憑借手工備份是很難做到的。 能更迅速、準確的恢復數(shù)據(jù) 備份軟件精確的知道每次備份發(fā)生的時間和內(nèi)容以及存放地點,能夠迅速找到并恢復數(shù)據(jù)。同時,也可以采用多種技術(shù)如從快照恢復、多流恢復等方法提高恢復速度。備份軟件也能提供更小顆粒的恢復功能。 1.3. 備份和恢復數(shù)據(jù)備份的根本目的,是重新利用,這也就是說,備份工作的核心是恢復,一個無法恢復的備份,對任何系統(tǒng)來說都是毫無意義的。在實際情況中,廠商或集成商更多的是向用戶吹噓,自己的產(chǎn)品在備份過程中如何的巧妙。然而,作為最終用戶,一定需要清醒的認識到,能夠安全、方便而又高效的恢復數(shù)據(jù),才是備份系統(tǒng)的真正生命所在。也許很多人會以為,既然備份系統(tǒng)已經(jīng)把需要的數(shù)據(jù)備份下來了,恢復應(yīng)該不成什么問題。這就大錯而特錯了,事實上,無論是在金融電信行業(yè)的數(shù)據(jù)中心,還是在普通的桌面級系統(tǒng)中,備份數(shù)據(jù)無法恢復,從而導致數(shù)據(jù)丟失的例子實在太多了。 眾所周知,建造大樓時一定會配備消防系統(tǒng),但是,并非有了消防系統(tǒng)就能高枕無憂。人們經(jīng)常獲悉,有的樓房突遭火災(zāi)時,消防系統(tǒng)卻無故癱瘓了,或者消防栓里沒有水,或者消防通道被堵塞,以致火勢蔓延,造成巨大的生命財產(chǎn)損失。因此,并非所有的消防系統(tǒng),在遭遇火災(zāi)時都能起作用。一樣的道理,數(shù)據(jù)備份設(shè)施之于IT系統(tǒng),就相當于消防系統(tǒng)之于樓房,它是保護IT系統(tǒng)的最后一道防線。即使配備了數(shù)據(jù)備份設(shè)施,并不表明在IT系統(tǒng)遇到問題時一定能將丟失的數(shù)據(jù)成功恢復。 為了進一步闡明恢復的重要性,讓我們再來對比一下備份和恢復操作的區(qū)別。 首先、 備份是計劃內(nèi)的工作,而恢復則是計劃外的工作。對于IT技術(shù)人員來說,備份是按照既定的備份策略,每隔一定時間,按部就班地操作即可。而恢復則是只有當發(fā)生數(shù)據(jù)丟失時,或者要查找歷史數(shù)據(jù)時,才會進行的操作。通常情況下,實施恢復操作時,往往都是十萬火急,越快越好,同時還希望恢復后的數(shù)據(jù)可用。由于備份對系統(tǒng) 環(huán)境 的影響比較大,所以備份的工作往往是在特定的時間內(nèi)完成的,也即所謂的“備份窗口”,這時生產(chǎn)系統(tǒng)通常不工作。而恢復,因為是計劃外的工作,對生產(chǎn)系統(tǒng)肯定會產(chǎn)生影響。下面以電子郵件數(shù)據(jù)的備份和恢復為例,來說明恢復對系統(tǒng)的影響。假定您對電子郵件系統(tǒng)的備份策略是每晚八點定時備份到磁帶,備份完成后磁帶里就會保存有昨天晚上八點之前收到的所有電子郵件。當然,收發(fā)電子郵件是一個連續(xù)的動作,晚上八點后,郵箱仍然在不停地收郵件。假設(shè)到了今天中午12點,您發(fā)現(xiàn)某一個重要的郵件不小心被刪掉了,如果這個郵件是昨天晚上八點前收到的,那么您還是有可能從磁帶里恢復該郵件。這時就要啟動恢復操作了。如果備份軟件能夠?qū)崿F(xiàn)郵件一級的恢復(恢復顆粒是單個郵件)的話,您只要能找到那封丟失的郵件,直接將它恢復到郵箱就可以了,恢復的過程對整個郵件系統(tǒng)沒有任何影響;但是,如果您的備份軟件只能做到郵箱級的恢復(恢復顆粒是一個郵箱),那么如果您想恢復該郵件的話,就不得不把整個郵箱恢復到昨晚八時的狀態(tài),造成的后果就是昨天晚上八點到今天上午12點收進的郵件會全部被覆蓋??梢?,如果從備份的角度來說,兩者沒什么區(qū)別;但是從恢復的角度來講,兩者差別很大。 第二、 備份是大批量的數(shù)據(jù)移動過程,往往需要將所有數(shù)據(jù)或所有增量數(shù)據(jù)全部拷貝到備份設(shè)備,而恢復往往是少量的數(shù)據(jù)移動過程,只需將需要恢復的數(shù)據(jù)從備份設(shè)備拷貝回主服務(wù)器?,F(xiàn)在市場上流行的很多備份軟件,基本上都是在上世紀80年代設(shè)計的,那時的數(shù)據(jù)量相對較?。◣资椎綆装僬祝?。當進行備份操作的時候,備份軟件會把所需要備份的數(shù)據(jù)文件打包成一個備份集(backup set),然后將它拷貝至備份設(shè)備中,并且針對該備份集形成相對應(yīng)的索引,但一般不會對備份集里的內(nèi)容建立詳細的索引。那么當需要恢復該備份集中的某一個文件時,備份軟件就必須從備份集中搜索到該文件,然后進行恢復。這在只有幾百兆數(shù)據(jù)量的IT環(huán)境下完全可行,然而來到我們目前所處的海量數(shù)據(jù)的時代,由于數(shù)據(jù)量已經(jīng)高達幾十甚至幾百TB,如果繼續(xù)沿用這種方式,勢必產(chǎn)生許多問題:從浩如煙淼的備份數(shù)據(jù)里,找到并恢復您需要的那一個,難度無異于大海撈針!例如,有的用戶去電信公司要求查詢自己的歷史話單(如兩年前的某一個月的通話記錄),今天,很多電信公司無法滿足用戶的這一需求,因為很多情況下明知該歷史話單一定存在于原先的備份介質(zhì)中,但由于數(shù)據(jù)量實在太大,幾乎沒有可操作性。這種情況下,備份雖然是成功的,但是恢復的成功率卻很低。早年的 調(diào)查 就 揭示了數(shù)據(jù)恢復的真相 ,即 恢復作業(yè)的平均成功率只有70%左右 。 當考慮數(shù)據(jù)保護時,應(yīng)著眼于“恢復”,需著重考慮以下幾點: 1.確保數(shù)據(jù)能夠恢復 2.恢復速度要盡量快 3.恢復操作對系統(tǒng)的影響要盡可能小 4.能夠恢復到用戶指定的時間點 5.恢復的數(shù)據(jù)是可以使用的 當然,恢復是在備份的基礎(chǔ)上進行的,如果備份失敗,恢復肯定不會成功。為了確保能達到恢復的目的,對備份操作有以下幾點基本要求: 1.提高備份成功率 備份過程中,當備份介質(zhì)、備份設(shè)備和網(wǎng)絡(luò)出現(xiàn)問題時,備份作業(yè)就會中斷,要提高備份的成功率,備份系統(tǒng)就應(yīng)具有容錯機制。如果是備份介質(zhì)或備份設(shè)備出現(xiàn)問題,可以將備份自動切換到其他的備份介質(zhì)、設(shè)備或路徑上,并能確保從中斷處繼續(xù)備份操作。另外,“備份的斷點續(xù)傳”也很重要,當網(wǎng)絡(luò)發(fā)生阻塞時,備份也會中斷;一旦網(wǎng)絡(luò)恢復正常,備份能從中斷處自動重啟并繼續(xù)進行。 2.精細的備份數(shù)據(jù)索引 當用戶希望恢復數(shù)據(jù)時,絕大多數(shù)情況下并不需要恢復整個系統(tǒng),而只要恢復部分數(shù)據(jù),甚至只是一個文件或郵件。索引做得足夠精細,有利于在恢復時能快速查找并定位所需要恢復的數(shù)據(jù),實現(xiàn)小顆?;謴?,同時將對系統(tǒng)的影響降到最小,恢復速度大幅提高。 3.能產(chǎn)生多個數(shù)據(jù)副本 為了防止備份數(shù)據(jù)意外損壞,產(chǎn)生多個備份副本是必要的,也很有效。產(chǎn)生數(shù)據(jù)副本的方法有兩種:同步和異步。同步的方法是,在備份時,同時把備份數(shù)據(jù)寫入到兩個不同的介質(zhì)中;異步的做法是,先把備份數(shù)據(jù)寫入一個介質(zhì),然后再利用空閑時段,將備份數(shù)據(jù)復制到其他介質(zhì)上。當然也可以通過網(wǎng)絡(luò)將其復制到異地,達到數(shù)據(jù)容災(zāi)的目的。 4.離場保護 如果數(shù)據(jù)備份是為了恢復而進行的,就應(yīng)該考慮到萬一數(shù)據(jù)中心遭遇災(zāi)難時,怎樣進行恢復。這時“離場保護”中保存的數(shù)據(jù)副本就會起到很大的作用。 5. 操作界面應(yīng)足夠簡單 用戶界面應(yīng)該面向恢復,而非面向備份。在面向數(shù)據(jù)恢復的用戶界面,所有的備份數(shù)據(jù)是按照數(shù)據(jù)原先的結(jié)構(gòu)來組織的,需要恢復哪個數(shù)據(jù),很快就能找到,輕松點擊一下就能恢復該數(shù)據(jù)了。 1.4. 備份結(jié)構(gòu)常見的數(shù)據(jù)備份系統(tǒng)主要有Host-Base、LAN-Base和基于SAN結(jié)構(gòu)的LAN-Free、Server-Free等多種結(jié)構(gòu)。 1.Host-Based備份方式: Host-Based是傳統(tǒng)的數(shù)據(jù)備份的結(jié)構(gòu)這種結(jié)構(gòu)中存儲介質(zhì)(例如磁帶庫)直接接在服務(wù)器上,而且只為該服務(wù)器提供數(shù)據(jù)備份服務(wù)。在大多數(shù)情況下,這種備份大多是采用服務(wù)器上自帶的磁帶機,而備份操作往往也是通過手工操作的方式進行的。 Host-Based備份結(jié)構(gòu)的優(yōu)點是數(shù)據(jù)傳輸速度快,備份管理簡單;缺點是不利于備份系統(tǒng)的共享,不適合于現(xiàn)在大型的數(shù)據(jù)備份要求。 2.LAN-Based備份方式: LAN-Based備份,在該系統(tǒng)中數(shù)據(jù)的傳輸是以網(wǎng)絡(luò)為基礎(chǔ)的。其中配置一臺服務(wù)器作為備份服務(wù)器,由它負責整個系統(tǒng)的備份操作。磁帶庫則接在某臺服務(wù)器上,在數(shù)據(jù)備份時備份對象把數(shù)據(jù)通過網(wǎng)絡(luò)傳輸?shù)酱艓熘袑崿F(xiàn)備份的。 LAN-Based備份結(jié)構(gòu)的優(yōu)點是節(jié)省投資、磁帶庫共享、集中備份管理;它的缺點是對業(yè)務(wù)網(wǎng)絡(luò)傳輸壓力大。 3.LAN-Free備份方式: LAN-Free和Server-Free的備份系統(tǒng)是建立在SAN(存儲區(qū)域網(wǎng))的基礎(chǔ)上的,其結(jié)構(gòu)如下圖所示?;赟AN的備份是一種徹底解決傳統(tǒng)備份方式需要占用LAN帶寬問題的解決方案。它采用一種全新的體系結(jié)構(gòu),將磁帶庫和磁盤陣列各自作為獨立的光纖結(jié)點,多臺主機共享磁帶庫備份時,數(shù)據(jù)流不再經(jīng)過網(wǎng)絡(luò)而直接從磁盤陣列傳到磁帶庫內(nèi),是一種無需占用網(wǎng)絡(luò)帶寬 (LAN-Free) 的解決方案。 目前隨著SAN技術(shù)的不斷進步,LAN-Free的結(jié)構(gòu)已經(jīng)相當成熟,而Server-Free的備份結(jié)構(gòu)則不太成熟。LAN-Free的優(yōu)點是數(shù)據(jù)備份統(tǒng)一管理、備份速度快、業(yè)務(wù)網(wǎng)絡(luò)傳輸壓力小、磁帶庫資源共享;缺點是投資高。 4.Server-Free備份方式 另外一種減少對系統(tǒng)資源消耗的辦法是采用無服務(wù)器(Serverless)備份技術(shù)。它是LAN-free的一種延伸,可使數(shù)據(jù)能夠在SAN結(jié)構(gòu)中的兩個存儲設(shè)備之間直接傳輸,通常是在磁盤陣列和磁帶庫之間。這種方案的主要優(yōu)點之一是不需要在服務(wù)器中緩存數(shù)據(jù),顯著減少對主機CPU的占用,提高操作系統(tǒng)工作效率,幫助企業(yè)完成更多的工作。 無服務(wù)器備份有幾種實施方式。 方法一,備份數(shù)據(jù)通過名為數(shù)據(jù)移動器的設(shè)備從磁盤陣列傳輸?shù)酱艓焐?。該設(shè)備可能是光纖通道交換機、存儲路由器、智能磁帶或磁盤設(shè)備或者是服務(wù)器。數(shù)據(jù)移動器執(zhí)行的命令其實是把數(shù)據(jù)從一個存儲設(shè)備傳輸?shù)搅硪粋€設(shè)備。實施這個過程的一種方法是借助于SCSI-3的擴展拷貝命令,它使服務(wù)器能夠發(fā)送命令給存儲設(shè)備,指示后者把數(shù)據(jù)直接傳輸?shù)搅硪粋€設(shè)備,不必通過服務(wù)器內(nèi)存。數(shù)據(jù)移動器收到擴展拷貝命令后,執(zhí)行相應(yīng)功能。它的 主要缺點是必須具備特殊的設(shè)備。無服務(wù)器備份要求使用支持SCSI-3 擴展復制命令集的智能設(shè)備。 方法二,通過備份服務(wù)器發(fā)送控制指令,首先對需要備份的數(shù)據(jù)卷做一個快照(或者其他類似操作),形成一個副本,然后用備份服務(wù)器將此快照卷Mount上,利用備份服務(wù)器將此卷上的數(shù)據(jù)備份至備份設(shè)備上。 1.5. 備份分類備份類型主要有三種:全備份,增量備份,差異備份,除此之外,很多備份軟件在這個基礎(chǔ)上還延伸出一些縮短備份或者恢復時間的備份方式,例如輔助副本備份、合成完全備份等等。 1.全備份 全備份將備份所有選定的文件,然后將每個文件標記為已備份(換句話說,存檔屬性被清除)。如果使用全備份,恢復所有文件時僅需具備最新的備份文件副本或磁帶,全備份通常在首次創(chuàng)建備份集時執(zhí)行。全備份的優(yōu)點是 易于查找文件,因為文件都位于當前備份媒體上。文件恢復只需要一種媒體或一組媒體。缺點是浪費時間和浪費空間, 如果文件不頻繁進行更改,備份內(nèi)容幾乎完全相同。 2.增量備份 增量備份僅備份那些自上次全備份或增量備份以來創(chuàng)建或更改的文件。增量備份將文件標記為已備份(換句話說,存檔屬性被清除)。如果結(jié)合全備份和增量備份,恢復所有數(shù)據(jù)時必須具備最新的全備份集和所有增量備份集。增量備份的優(yōu)點是 需要存儲的數(shù)據(jù)最少 , 備份速度最快。缺點是 完全 恢復 系統(tǒng)需要的時間比 全 備份或差異備份長。 3.差異備份 差異備份僅備份那些自上次全備份或增量備份以來創(chuàng)建或更改的文件。差異備份不將文件標記為已備份(換句話說,存檔屬性不被清除)。如果結(jié)合全備份和差異備份,恢復所有數(shù)據(jù)時既需要最新全備份的文件或磁帶,也需要最新差異備份的文件或磁帶。差異備份的優(yōu)點是 恢復時僅需 要 最新 全 備份的媒體和差異備份的媒體 , 備份速度比 全 備份快。缺點是 完全 恢復 系統(tǒng)需要的時間比 全 備份長。如果大量數(shù)據(jù)發(fā)生變化,備份所需的時間長于增量備份的時間。 4.輔助副本 輔助(或次要)副本是備份數(shù)據(jù)的副本。已復制的數(shù)據(jù)是主要備份副本的真實映像。如果主要備份服務(wù)器、設(shè)備和媒體丟失或損壞,已復制的數(shù)據(jù)可用作熱備用備份副本。主要副本和次要副本使用不同的媒體,通常使用不同的備份庫。輔助副本的優(yōu)點是 制作備用的備份磁帶原樣副本。與實際副本相比,輔助副本的生成速度更快。副本可現(xiàn)場保存供災(zāi)難恢復之用。但是這種延伸的技術(shù)不是所有備份管理軟件都很好支持的功能。 5.合成全備份 合成備份(Synthetic backup)的含義就是將一個全備份和一些增量備份或者差分備份重新組成一個全備份,這樣在恢復的時候,就好像一個全備份恢復一樣快捷;而且這部分發(fā)生在介質(zhì)管理器而不是客戶端,可以有效利用空間并且減小客戶端的負載。一般的用戶可能不熟悉合成備份的用法,一般來說,合成備份可以將多個備份整合成一個可用的恢復文件,所以可以將它和傳統(tǒng)備份統(tǒng)一起來使用。舉例來說,如果用戶創(chuàng)建一個三個月一次的全備份、每天一次的差分備份、一周一次的合成備份,那么每個星期一次的合成備份就會把上周的全備份和周內(nèi)的差分備份,重新合成一個全備份文件,就好像每周一次全備份一樣,而這樣做的好處是將合成備份的工作移到介質(zhì)服務(wù)器中完成,減少了客戶端的負載。合成備份的優(yōu)點是 將 全 備份和增量備份合并到一個新的 全 備份中,該 全 備份位于保存在網(wǎng)絡(luò)和/或關(guān)鍵服務(wù)器之外的庫中。備份和還原時間減少。這種功能也是某些備份管理軟件的增值功能,不具有普適性。 1.6. RTO與RPO在業(yè)務(wù)連續(xù)性管理中,RPO(Recovery Point Objective)是指能把數(shù)據(jù)恢復到過去的那一個時間點,RTO(Recovery Time Objective)是指在出現(xiàn)問題后,什么時候可以恢復數(shù)據(jù)。RPO可簡單的描述為企業(yè)能容忍的最大數(shù)據(jù)丟失量,RTO可簡單的描述為企業(yè)能容忍的恢復時間。 1.7. 備份設(shè)備現(xiàn)在企業(yè)常用的備份設(shè)備和介質(zhì)是磁盤,磁帶和光盤。歷史上很多其他備份介質(zhì)逐漸淘汰了。 1.磁盤備份設(shè)備 磁盤備份設(shè)備通常是H DD(硬盤驅(qū)動器(Hard Disk Drive)) 或者S DD ( 固態(tài)硬盤(Solid State Drive)) 介質(zhì),用于備份的磁盤一般考慮大容量,價格低廉。在備份管理軟件中通常是由一個或者多個訪問路徑組成,可以是本地磁盤,也可以是遠程訪問路徑的網(wǎng)絡(luò)文件系統(tǒng)。每個訪問路徑就是在磁盤上的一個目錄。在備份管理軟件中定義的磁盤備份設(shè)備一般采用文件系統(tǒng),備份的數(shù)據(jù)都是以文件方式存放在磁盤備份設(shè)備上的。這樣便于數(shù)據(jù)的管理和跨平臺的遷移。 磁盤備份設(shè)備有一些特點,例如不支持硬件壓縮;隨機訪問速度快;在大數(shù)據(jù)流的備份和恢復中,可能比磁帶設(shè)備慢,磁帶更容易實現(xiàn)多流并發(fā)操作;通常情況下,備份數(shù)據(jù)不能離線拿走;由于磁盤設(shè)備是一個在線檢測設(shè)備,所以存放備份數(shù)據(jù)的可靠性,通常會比磁帶高。 2.磁帶備份設(shè)備 磁帶設(shè)備通常分為2種: 物理磁帶機:只有一個磁帶驅(qū)動器,通常不包括任何其它機器裝置。通常磁帶機都是內(nèi)置在服務(wù)器中的。由于磁帶機的物理特性,所以管理比較復雜。 物理磁帶庫:包括自動裝載機(AutoLoader)和帶庫(TapeLibrary)。它們的特點都是除了磁帶驅(qū)動器外,還有一個機器手臂,來自動控制和裝載磁帶。 3.光盤備份設(shè)備 光盤是以光信息做為存儲的載體并用來存儲數(shù)據(jù)的一種物品。分不可擦寫光盤,如 CD-ROM 、 DVD-ROM 等;和可擦寫光盤,如CD-RW、 DVD-RAM 等。藍光光碟( Blu-ray Disc ,簡稱BD)是指DVD之后的下一代光盤格式之一,用以存儲高品質(zhì)的影音文件以及高容量的 數(shù)據(jù)存儲 。 光盤是利用激光原理進行讀、寫的設(shè)備,是迅速發(fā)展的一種輔助 存儲器 ,可以存放各種文字、聲音、圖形、圖像和動畫等多媒體數(shù)字信息。 光盤備份設(shè)備也分為光盤刻錄機和光盤庫。 4.虛擬磁帶庫 虛擬帶庫( Virtual Tape Library,VTL )就是以磁盤作為自身存儲介質(zhì),并能仿真為物理磁帶庫的產(chǎn)品。簡單的說,虛擬帶庫就是將磁盤空間虛擬為磁帶空間,能夠在傳統(tǒng)的備份軟件上實現(xiàn)和傳統(tǒng)磁帶庫同樣功能的產(chǎn)品。 傳統(tǒng)的磁帶庫的存儲介質(zhì)為磁帶,磁帶的優(yōu)勢是可以集中的保存,數(shù)據(jù)的移動比較方便,但是磁帶介質(zhì)不是非常穩(wěn)定,容易受粉塵、濕度、磁粉、粘連、霉點等因素的影響,出現(xiàn)讀寫錯誤 ,對保存環(huán)境的要求比較高。帶庫里面的機械手和驅(qū)動器屬于精密機械設(shè)備,經(jīng)常容易發(fā)生故障,速度比較慢,恢復時間比較長。 虛擬帶庫將使用磁盤做為存儲介質(zhì),使用軟件在邏輯上將磁盤存儲系統(tǒng)(包括SCSI或者光纖陣列或者SAN存儲網(wǎng)絡(luò)等)虛擬為傳統(tǒng)的磁帶庫設(shè)備,自動的在邏輯上實現(xiàn)機械手,驅(qū)動器的功能,磁盤存儲系統(tǒng)的RAID,鏡像等功能可以從底層保護備份的數(shù)據(jù)。虛擬磁帶庫能夠和各大廠家的備份軟件無縫的兼容,實現(xiàn)許多高級的備份功能,最大程度上保護用戶的數(shù)據(jù)。 虛擬帶庫的實現(xiàn)可以大致分為三種方式。第一,純軟件方式,即 將磁帶庫模擬軟件直接安裝在備份服務(wù)器上,把備份 管理 服務(wù)器的文件系統(tǒng)分區(qū)模擬成磁帶庫,從而使備份軟件以磁帶庫方式使用磁盤文件系統(tǒng) ,目前有廠家在備份軟件里面集成了類似的產(chǎn)品 。這種方式磁盤本質(zhì)上仍然在線,而且對備份主機的負擔比較大,使用的環(huán)境有局限性,優(yōu)點是成本比較低。第二種, 專用服務(wù)器級虛擬磁帶庫方案 , 該方案實際上是另外一種虛擬磁帶庫的軟件實現(xiàn)方案 , 通過把虛擬磁帶庫管理軟件安裝在一臺獨立的專用服務(wù)器內(nèi),而將該服務(wù)器及所連接的磁盤存儲設(shè)備模擬成磁帶庫。這種方案的 特點是速度比較快,而且數(shù)據(jù)受主機的影響小, 不足是需要利用一臺的服務(wù)器作為虛擬磁帶庫管理器,系統(tǒng)優(yōu)化性略低。第三, 專用控制器級集成虛擬磁帶庫設(shè)備方案, 將磁帶庫模擬管理軟件固化在特別設(shè)計的硬件設(shè)備中,就形成了專用的虛擬磁帶庫設(shè)備,這種設(shè)備需要配置一定數(shù)量和類型的主機接口和后端存儲磁盤陣列接口。專用的虛擬磁帶庫設(shè)備硬件結(jié)構(gòu)與不同于服務(wù)器,設(shè)計采用了精簡的硬件模塊和精簡的操作系統(tǒng)內(nèi)核(一般為Linux內(nèi)核),并且充分考慮了與主機及存儲設(shè)備的連接能力 。專用的虛擬磁帶庫設(shè)備 的出現(xiàn) 標志著虛擬磁帶庫技術(shù)終于突破了操作系統(tǒng)和PC服務(wù)器架構(gòu)的限制,使虛擬磁帶庫真正成為了一種獨立的外設(shè),其使用方式也更接近普通磁帶庫,而其優(yōu)越性能也體現(xiàn)得更加充分。 1.8. 備份的數(shù)據(jù)類型需要備份的數(shù)據(jù)主要分兩類,即非結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)。 通常把沒有“數(shù)據(jù)模型”的計算機信息稱為非結(jié)構(gòu)化數(shù)據(jù),例如文字、圖、音頻、視頻Microsoft Office 文檔, Web頁面,等。非結(jié)構(gòu)化數(shù)據(jù)多存放于文件系統(tǒng)中,所以備份的時候多數(shù)按照文件系統(tǒng)備份方式進行備份。 結(jié)構(gòu)化數(shù)據(jù),通常是數(shù)據(jù)庫的數(shù)據(jù),例如傳統(tǒng)的關(guān)系型數(shù)據(jù)庫。結(jié)構(gòu)化數(shù)據(jù)的備份根據(jù)不同的數(shù)據(jù)庫特點,有各自獨特的備份方式。 2. 數(shù)據(jù)備份策略設(shè)計企業(yè)在做數(shù)據(jù)備份策略設(shè)計的時候通??紤]備份對象,備份結(jié)構(gòu),備份方式,備份周期,備份窗口,數(shù)據(jù)保留周期,備份介質(zhì)等等方面。 2.1. 備份對象的確定備份對象,即備份哪臺主機上的哪些數(shù)據(jù),企業(yè)用戶在收集這個信息的時候需要細致,因為不同的備份對象,有不同的備份實現(xiàn)方案,例如操作系統(tǒng)本身的備份,看似和普通文件系統(tǒng)類似,但是操作系統(tǒng)通常不能按照普通文件系統(tǒng)來進行備份,需要考慮操作系統(tǒng)崩潰之后如何從備份介質(zhì)中恢復,如何引導操作系統(tǒng)啟動,同時基于windows和unix、linux操作系統(tǒng)還有不同的備份和恢復方式。又例如,同樣是linux文件系統(tǒng),但是掛載本地文件系統(tǒng)和掛載遠程共享文件系統(tǒng),所需要的備份方案也不盡相同。一個大型的I T 系統(tǒng)里自身比較復雜,有多種類型的備份對象,也有一些大型的I T 系統(tǒng)是有很多耦合度較高的子系統(tǒng)組成,那么在考慮備份對象的時候,不可以只考慮單一系統(tǒng)的某個單個類型的備份對象,要基于整個系統(tǒng)能夠恢復為出發(fā)點來綜合考慮所有相關(guān)聯(lián)的備份對象。 2.2. 備份方式備份方式,采用全備份或全備份與增量備份相結(jié)合的方式;這是需要結(jié)合恢復來綜合考慮的,因為備份的主要目的是用來恢復,例如每天全備份,那么恢復的時候復雜程度就降低了,直接拿匹配的備份集來恢復就可以了。但是帶來的問題是每天備份窗口時間長,需要的備份存儲空間大,備份時系統(tǒng)性能影響時間長。如何取舍,需要根據(jù)系統(tǒng)的重要程度,備份的數(shù)據(jù)量,備份窗口,恢復的要求等等方面綜合考慮。 2.3. 備份計劃在備份系統(tǒng)中,用戶必須制定備份計劃來實施備份;備份計劃說明了,用戶準備在何時,對哪臺服務(wù)器上的哪些內(nèi)容,進行什么類型的備份。備份計劃牽涉到了備份的時間,備份的內(nèi)容,備份的類型,備份的方式。一般而言,在備份系統(tǒng)中,用戶可以制定一個或多個備份計劃的策略,從而減少制定備份計劃的工作量。 企業(yè)用戶的IT 環(huán)境復雜多樣,不同的系統(tǒng)、應(yīng)用對備份都有各自的需求,所以針對不同的需要,往往需要制定不同的備份計劃。 采用全備份還是全備份與增量備份相結(jié)合的備份方式,這是需要結(jié)合恢復來綜合考慮的,因為備份的主要目的是用來恢復,例如每天全備份,那么恢復的時候復雜程度就降低了,直接拿匹配的備份集來恢復就可以了。但是帶來的問題是每天備份窗口時間長,需要的備份存儲空間大,備份時系統(tǒng)性能影響時間長。如何取舍,需要根據(jù)系統(tǒng)的重要程度,備份的數(shù)據(jù)量,備份窗口,恢復的要求等等方面綜合考慮。
2.4. 備份周期 備份周期,每隔多長時間進行一次備份;這個需要和備份方式以及備份窗口相結(jié)合來設(shè)計。在保護客戶投資期間內(nèi),一個完整的備份周期是指包含第n-1次完全備份和第n-1次完全備份與第n次完全備份之間的增量備份總合。如何評估備份對象應(yīng)該每隔多長時間做一次備份呢,可以參考R PO 這個指標的設(shè)定,即能夠容忍最多丟失多長時間段的數(shù)據(jù)。比如企業(yè)能夠容忍丟失 10 個小時的數(shù)據(jù),一次備份需要花費1個小時的時間,那么每兩個備份周期的時間間隔,應(yīng)該小于9個小時。 2.5. 備份窗口備份窗口,每次數(shù)據(jù)備份何時開始,所占用的時間窗口;業(yè)界有兩種觀點,一種認為備份窗口是備份所消耗的時間,另一種認為是企業(yè)可以允許某個時間段對于某一個系統(tǒng)進行備份。更多的觀點更傾向于后者,請注意,備份作業(yè)會占用系統(tǒng)資源的,所以需要合理規(guī)劃出一個時間段來進行備份,那么這就是備份窗口。 2.6. 數(shù)據(jù)保留數(shù)據(jù)保存周期,備份數(shù)據(jù)在多長時間內(nèi)有效;這是和企業(yè)對數(shù)據(jù)生命周期管理的約定,以及監(jiān)管部門對企業(yè)數(shù)據(jù)保護的要求。 數(shù)據(jù)備份到備份介質(zhì)上的時候,會占用介質(zhì)空間;如果不制定數(shù)據(jù)保留策略的話,那么每天產(chǎn)生的備份數(shù)據(jù)將不停的占用備份介質(zhì),從而將所有的備份介質(zhì)空間占滿。所以必須制定一個數(shù)據(jù)保留策略,來回收過期數(shù)據(jù)所占用的介質(zhì)空間,或者將備份數(shù)據(jù)從一個備份介質(zhì)上搬遷到其它介質(zhì)上。 數(shù)據(jù)保留策略的幾個術(shù)語: 歸檔數(shù)據(jù):往往指的是這些備份介質(zhì)必須被保留很長時間,往往>=1年;同時經(jīng)常是被保留在異地,例如:銀行,保險柜等。這些數(shù)據(jù)通常是以全備份的方式保留的。例如:每年保留1個全備份,保留10年。 循環(huán)周期:指的是備份數(shù)據(jù)經(jīng)過了一個循環(huán),1個循環(huán)包括了1個全備份和到下一個全備份間的所有其它類型的備份。 保留時間:指的是備份數(shù)據(jù)需要保留的天數(shù)。 數(shù)據(jù)保留策略關(guān)系到介質(zhì)空間容量的設(shè)計,同時還應(yīng)該定義一個保護用戶投資的期限,即空間容量的設(shè)計要滿足一定時期內(nèi)的峰值。 數(shù)據(jù)保留設(shè)計原則:
2.7. 備份結(jié)構(gòu) 備份結(jié)構(gòu),采用 LAN-Free 還是 LAN 方式進行備份;目前企業(yè)中的備份結(jié)構(gòu)絕大部分都可以歸納為這兩種,主要關(guān)注的是備份的時候的數(shù)據(jù)流和控制流的走向,通常情況下控制流需要通過L AN 網(wǎng)絡(luò)傳輸,數(shù)據(jù)流是根據(jù)備份結(jié)構(gòu)設(shè)計的。充分計算數(shù)據(jù)量的總量和備份效率,評估備份對L AN 網(wǎng)絡(luò)的壓力,這里的L AN 網(wǎng)絡(luò)通常指業(yè)務(wù)網(wǎng)絡(luò),當前企業(yè)中通常是以太網(wǎng)網(wǎng)絡(luò)作為業(yè)務(wù)訪問網(wǎng)絡(luò)。L AN- Free的誕生主要就是為了解放對業(yè)務(wù)網(wǎng)絡(luò)的壓力,請注意L AN- Free設(shè)計的初衷是針對業(yè)務(wù)網(wǎng)絡(luò)而不是特指以太網(wǎng)絡(luò),這其實也是S AN 網(wǎng)絡(luò)誕生的時候被稱為第二網(wǎng)絡(luò)的原因?;谶@個觀點,只要備份的數(shù)據(jù)流通過非業(yè)務(wù)網(wǎng)絡(luò)傳輸,就實現(xiàn)了L AN-F ree。但是業(yè)界也有很多人的觀點,直接就把L AN-F ree和基于光纖通道技術(shù)的S AN 網(wǎng)絡(luò)結(jié)合在一起了。請注意備份結(jié)構(gòu)的設(shè)計,在投資允許的情況下,盡可能的要把備份的網(wǎng)絡(luò),即備份數(shù)據(jù)流傳輸?shù)木W(wǎng)絡(luò),和業(yè)務(wù)網(wǎng)絡(luò)分開。 2.8. 多份拷貝備份數(shù)據(jù)是否進行多份拷貝;多個副本是非常有意義的,能夠更好的保證數(shù)據(jù)安全,如何做多個拷貝不同的備份管理軟件是有區(qū)別的,有備份的同時就生成兩個副本,也有通過主拷貝生成的副本拷貝,還有通過介質(zhì)的特性例如虛擬磁帶庫實現(xiàn)副本的本地或者異地拷貝。 2.9. 介質(zhì)和備份設(shè)備備份介質(zhì),備份數(shù)據(jù)使用哪種備份設(shè)備存儲數(shù)據(jù)(物理磁帶庫、虛擬磁帶庫、磁盤緩存設(shè)備,或者以上設(shè)備的組合),以及所使用的磁帶邏輯卷池等。 介質(zhì)離線存放,監(jiān)管機構(gòu)和有一些企業(yè)自身對數(shù)據(jù)安全的管理比較嚴格,是需要做介質(zhì)離線并異地存放的。物理磁帶和光盤介質(zhì)是具備離線存放的。拿物理磁帶庫來說,做物理磁帶的出庫,并做登記,異地存放。需要注意的是要有比較完善的管理,最好的方式通過軟件進行出庫管理,并且能夠和備份和恢復結(jié)合起來。介質(zhì)存放的地點環(huán)境要符合介質(zhì)長期存放的要求,確保介質(zhì)不會受損影響未來需要時的恢復。 備份設(shè)備在備份系統(tǒng)里的功能主要是提供了備份數(shù)據(jù)路徑和提供了備份介質(zhì)用來存儲數(shù)據(jù)。目前企業(yè)主要的備份設(shè)備是磁盤、磁帶和光盤。有一些備份一體機實際存儲介質(zhì)是磁盤,物理和虛擬磁帶庫的存儲方式是按照磁帶的數(shù)據(jù)格式存儲,但是虛擬磁帶庫實際的存儲介質(zhì)也是磁盤,光盤介質(zhì)不同于磁帶的線性存儲方式,寫入和讀取的方式和磁帶不同,和物理磁盤接近,同時也具有離線存儲的功能特性。 針對磁盤備份設(shè)備而言,相對來說管理設(shè)計比較簡單,只要有足夠的空間,磁盤有足夠的性能,就能備份。而且由于磁盤是個隨機設(shè)備,所以在剪除過期數(shù)據(jù)的時候,沒有比較多的考慮。而磁帶備份設(shè)備相對復雜,備份的時候采用驅(qū)動器往往只能備份一個任務(wù);而備份的介質(zhì)是以磁帶方式存放在帶庫中的磁帶槽位中;因此在這里我們主要介紹備份系統(tǒng)中磁帶備份設(shè)備和相關(guān)的設(shè)計原則,光盤備份設(shè)備也可以參考。 磁帶備份設(shè)備的設(shè)計主要考慮兩個方面:一是備份數(shù)據(jù)流,這個主要涉及驅(qū)動器池設(shè)計;另一個是備份介質(zhì)池,這個涉及備份磁帶池設(shè)計。 備份數(shù)據(jù)流設(shè)計原則:在備份系統(tǒng)中,可以將磁帶庫中一個或多個驅(qū)動器分配到一個或多個驅(qū)動器池中。這樣用戶就可以根據(jù)備份數(shù)據(jù)的多少和重要程度,合理的調(diào)配驅(qū)動器資源;確保重要數(shù)據(jù)能夠及時備份,或者將多個任務(wù)負載均衡。 劃分驅(qū)動器池的原則:確保最重要的備份任務(wù)有足夠的驅(qū)動器能夠備份數(shù)據(jù)。確保驅(qū)動器池最少,避免浪費??梢酝ㄟ^劃分任務(wù)優(yōu)先級,來使得重要的備份任務(wù)能夠優(yōu)先得到驅(qū)動器池中的資源。 備份介質(zhì)池:在備份系統(tǒng)中,可以將不同槽位上的磁帶分配到不同的介質(zhì)池中,從而便于管理和維護。建議在備份管理系統(tǒng)中開啟介質(zhì)的條碼或者標簽管理,介質(zhì)池的劃分可以按保留時間或存儲策略方式來劃分的。 劃分介質(zhì)池的原則:介質(zhì)池的數(shù)量盡量少,從而減少管理復雜度,使得磁帶空間能夠盡量共享,減少磁帶空間浪費。按保留時間的不同來劃分介質(zhì)池。例如:14天的1個介質(zhì)池,1個月的1個介質(zhì)池。按磁帶的用途來劃分介質(zhì)池。例如:1個介質(zhì)池是專門存放在線磁帶,用于恢復的;1個介質(zhì)池是存放離線拿走磁帶的。按存儲策略個數(shù)或者用途來劃分。 2.10. 元數(shù)據(jù)備份備份管理系統(tǒng)是做備份管理的,備份數(shù)據(jù)的主要目的就是用來做恢復,備份的數(shù)據(jù)是企業(yè)的重要數(shù)據(jù),那么管理備份數(shù)據(jù)的管理系統(tǒng)也是重要系統(tǒng),備份系統(tǒng)元數(shù)據(jù)包括:備份的匯總索引,用戶定義的備份計劃和保留策略,相關(guān)客戶端和備份設(shè)備。所以保護元數(shù)據(jù)非常重要。 專業(yè)的企業(yè)級備份管理系統(tǒng)都有專門的工具和策略來保護元數(shù)據(jù)庫。如果備份系統(tǒng)沒有保護元數(shù)據(jù)的專用工具,請定期將備份管理服務(wù)器上備份系統(tǒng)安裝路徑上的文件,復制到其它硬盤或設(shè)備上。請?zhí)貏e注意每一個備份集和備份管理系統(tǒng)的元數(shù)據(jù)中的備份索引之間的聯(lián)系,備份數(shù)據(jù)的同時要關(guān)注備份索引的備份,恢復數(shù)據(jù)的時候要考慮備份索引數(shù)據(jù)的恢復和極限情況下整個備份管理系統(tǒng)的恢復。
|
|
來自: 靜靜的看一看 > 《大數(shù)據(jù)》