一、理解什么是數(shù)據(jù)庫恢復(fù)
當(dāng)
我們使用一個(gè)數(shù)據(jù)庫時(shí),總希望數(shù)據(jù)庫的內(nèi)容是可靠的、正確的,但由于計(jì)算機(jī)系統(tǒng)的故障(硬件故障、軟件故障、網(wǎng)絡(luò)故障、進(jìn)程故障和系統(tǒng)故障)影響數(shù)據(jù)庫系
統(tǒng)的操作,影響數(shù)據(jù)庫中數(shù)據(jù)的正確性,甚至破壞數(shù)據(jù)庫,使數(shù)據(jù)庫中全部或部分?jǐn)?shù)據(jù)丟失。因此當(dāng)發(fā)生上述故障后,希望能重構(gòu)這個(gè)完整的數(shù)據(jù)庫,該處理稱為數(shù)
據(jù)庫恢復(fù)?;謴?fù)過程大致可以分為復(fù)原(Restore)與恢復(fù)(Recover)過程。
數(shù)據(jù)庫恢復(fù)可以分為以下兩類:
1、實(shí)例故障的一致性恢復(fù)
當(dāng)實(shí)例意外地(如掉電、后臺(tái)進(jìn)程故障等)或預(yù)料地(發(fā)出SHUTDOUM ABORT語句)中止時(shí)出現(xiàn)實(shí)例故障,此時(shí)需要實(shí)例恢復(fù)。實(shí)例恢復(fù)將數(shù)據(jù)庫恢復(fù)到故障之前的事務(wù)一致狀態(tài)。如果在在線后備發(fā)現(xiàn)實(shí)例故障,則需介質(zhì)恢復(fù)。在其它情況ORACLE在下次數(shù)據(jù)庫起動(dòng)時(shí)(對(duì)新實(shí)例裝載和打開),自動(dòng)地執(zhí)行實(shí)例恢復(fù)。如果需要,從裝載狀態(tài)變?yōu)榇蜷_狀態(tài),自動(dòng)地激發(fā)實(shí)例恢復(fù),由下列處理:
(1)
為了解恢復(fù)數(shù)據(jù)文件中沒有記錄的數(shù)據(jù),進(jìn)行向前滾。該數(shù)據(jù)記錄在在線日志,包括對(duì)回滾段的內(nèi)容恢復(fù)。
(2) 回滾未提交的事務(wù),按步(1)重新生成回滾段所指定的操作。
(3) 釋放在故障時(shí)正在處理事務(wù)所持有的資源。
(4)
解決在故障時(shí)正經(jīng)歷一階段提交的任何懸而未決的分布事務(wù)。
2、介質(zhì)故障或文件錯(cuò)誤的不一致恢復(fù)
介質(zhì)故障是當(dāng)一個(gè)文件、一個(gè)文件的部分或磁盤不能讀或不能寫時(shí)出現(xiàn)的故障。
文件錯(cuò)誤一般指意外的錯(cuò)誤導(dǎo)致文件被刪除或意外事故導(dǎo)致文件的不一致。
這種狀態(tài)下的數(shù)據(jù)庫都是不一致的,需要DBA手工來進(jìn)行數(shù)據(jù)庫的恢復(fù),這種恢復(fù)有兩種形式,決定于數(shù)據(jù)庫運(yùn)行的歸檔方式和備份方式。
(1)
完全介質(zhì)恢復(fù)可恢復(fù)全部丟失的修改。一般情況下需要有數(shù)據(jù)庫的備份且數(shù)據(jù)庫運(yùn)行在歸檔狀態(tài)下并且有可用歸檔日志時(shí)才可能。對(duì)于不同類型的錯(cuò)誤,有不同類型的完全恢復(fù)可使用,其決定于毀壞文件和數(shù)據(jù)庫的可用性。
(2)
不完全介質(zhì)恢復(fù)是在完全介質(zhì)恢復(fù)不可能或不要求時(shí)進(jìn)行的介質(zhì)恢復(fù)。重構(gòu)受損的數(shù)據(jù)庫,使其恢復(fù)介質(zhì)故障前或用戶出錯(cuò)之前的一個(gè)事務(wù)一致性狀態(tài)。不完全介質(zhì)恢復(fù)有不同類型的使用,決定于需要不完全介質(zhì)恢復(fù)的情況,有下列類型:基于撤消、基于時(shí)間和基于修改的不完全恢復(fù)。
基于撤消(CANCEL)恢復(fù):在某種情況,不完全介質(zhì)恢復(fù)必須被控制,DBA可撤消在指定點(diǎn)的操作?;诔废幕謴?fù)地在一個(gè)或多個(gè)日志組(在線的或歸檔的)已被介質(zhì)故障所破壞,不能用于恢復(fù)過程時(shí)使用,所以介質(zhì)恢復(fù)必須控制,以致在使用最近的、未損的日志組于數(shù)據(jù)文件后中止恢復(fù)操作。
基于時(shí)間(TIME)和基于修改(SCN)的恢復(fù):如果DBA希望恢復(fù)到過去的某個(gè)指定點(diǎn),是一種理想的不完全介質(zhì)恢復(fù),一般發(fā)生在恢復(fù)到某個(gè)特定操作之前,恢復(fù)到如意外刪除某個(gè)數(shù)據(jù)表之前。
二、數(shù)據(jù)庫恢復(fù)案例測試環(huán)境
1、數(shù)據(jù)庫環(huán)境
以下的所有案例都是通過測試經(jīng)過,環(huán)境為:
OS:Microsoft Windows XP [版本 5.1.2600]
DB:Oracle9i Enterprise Edition Release 9.2.0.1.0 - Production
DBNAME:DODO
數(shù)據(jù)文件:
SQL> select file#,status,enabled,name from
v$datafile;
FILE# STATUS
ENABLED
NAME
------ ------- ----------
----------------------------------------
1 SYSTEM READ WRITE
D:\ORACLE\ORADATA\DODO\SYSTEM01.DBF
2 ONLINE READ WRITE
D:\ORACLE\ORADATA\DODO\UNDOTBS01.DBF
3 ONLINE READ WRITE
D:\ORACLE\ORADATA\DODO\DRSYS01.DBF
4 ONLINE READ WRITE
D:\ORACLE\ORADATA\DODO\INDX01.DBF
5 ONLINE READ WRITE
D:\ORACLE\ORADATA\DODO\TOOLS01.DBF
6 ONLINE READ WRITE
D:\ORACLE\ORADATA\DODO\USERS01.DBF
7 ONLINE READ WRITE
D:\ORACLE\ORADATA\DODO\XDB01.DBF
8 ONLINE READ WRITE
D:\ORACLE\ORADATA\DODO\WXQ_TBS.ORA
9 ONLINE READ WRITE
D:\ORACLE\ORADATA\DODO\RECOVERY_TBS.ORA
控制文件:
SQL> select * from v$controlfile;
STATUS NAME
-------
----------------------------------------
D:\ORACLE\ORADATA\DODO\CONTROL01.CTL
D:\ORACLE\ORADATA\DODO\CONTROL02.CTL
D:\ORACLE\ORADATA\DODO\CONTROL03.CTL
聯(lián)機(jī)日志:
SQL> select * from v$logfile;
GROUP# STATUS
TYPE
MEMBER
------
------- ------- --------------------------------------
1
ONLINE D:\ORACLE\ORADATA\DODO\REDO01.LOG
2
ONLINE D:\ORACLE\ORADATA\DODO\REDO02.LOG
3 STALE
ONLINE
D:\ORACLE\ORADATA\DODO\REDO03.LOG
2、數(shù)據(jù)庫備份腳本
冷備份腳本
rem script:coldbak.sql
rem desc:offline full backup database
--connect database
connect sys/sys as sysdba;
--shutdown database
shutdown immediate;
--Copy Data file
host xcopy
D:\ORACLE\ORADATA\DODO\*.DBF D:\DATABASE\BACK /H/R/Y;
--Copy Control file
host xcopy
D:\ORACLE\ORADATA\DODO\*.CTL D:\DATABASE\BACK /H/R/Y;
--Copy Log file
host xcopy
D:\ORACLE\ORADATA\DODO\*.LOG D:\DATABASE\BACK /H/R/Y;
--startup database
startup;
注:unix中使用cp命令;可使用select及spool命令,通過查詢自動(dòng)生成備份腳本
說明:
1、以上腳本在數(shù)據(jù)庫關(guān)閉狀態(tài)下備份數(shù)據(jù)庫所有的數(shù)據(jù)文件、聯(lián)機(jī)日志、控制文件(在一個(gè)目錄下),如果成功備份,所有文件是一致的。
2、沒有備份參數(shù)文件,參數(shù)文件可以另外備份,沒有必要每次都備份,只需要在改變?cè)O(shè)置后備份一次。
3、如果以上命令沒有成功依次執(zhí)行,那么備份將是無效的,如連接數(shù)據(jù)庫不成功,那么肯定關(guān)閉數(shù)據(jù)庫也不成功,那么備份則無效
4、冷備份建議下人工干預(yù)下執(zhí)行。
數(shù)據(jù)庫OS熱全備份腳本
rem script:hotbak.sql
rem desc:backup all database datafile in archive
--connect database
connect sys/sys as sysdba;
--archive
alter system archive log current;
--start
alter tablespace system begin backup;
hostxcopy D:\ORACLE\ORADATA\DODO\SYSTEM01.DBF D:\DATABASE\BACK /H/R/Y;
alter tablespace system end backup;
alter tablespace undotbs1 begin backup;
hostxcopy D:\ORACLE\ORADATA\DODO\UNDOTBS01.DBF D:\DATABASE\BACK /H/R/Y;
alter tablespace undotbs1
end backup;
alter tablespace users begin backup;
hostxcopy
D:\ORACLE\ORADATA\DODO\USERS01.DBF D:\DATABASE\BACK /H/R/Y;
alter tablespace users end backup;
alter tablespace tools begin backup;
hostxcopy D:\ORACLE\ORADATA\DODO\TOOLS01.DBF D:\DATABASE\BACK /H/R/Y;
alter tablespace tools end backup;
alter tablespace indx begin backup;
hostxcopy D:\ORACLE\ORADATA\DODO\INDX01.DBF D:\DATABASE\BACK /H/R/Y;
alter tablespace indx end backup;
--end
--bak control file
--binary
alter database backup controlfile to 'D:\DATABASE\BACK\CONTROLFILE\CONTROLBAK.000';
--ascii
alter database backup controlfile to trace;
alter system archive log current;
說明:
1、熱備份必須在數(shù)據(jù)庫歸檔方式下才可以運(yùn)行
2、以上腳本可以在數(shù)據(jù)庫運(yùn)行狀態(tài)下備份數(shù)據(jù)庫所有的數(shù)據(jù)文件(除了臨時(shí)數(shù)據(jù)文件),沒有必要備份聯(lián)機(jī)日志。
3、歸檔日志至少需要一次完整備份之后的所有日志。
4、如果以上命令沒有成功依次執(zhí)行,那么備份也是無效的,如連接數(shù)據(jù)庫不成功,那么備份則無效
RMAN備份只講敘有恢復(fù)目錄的情況,如果沒有恢復(fù)目錄,情形大致相似。
以下是RMAN的熱備份全備份的腳本:
#
script:bakup.rcv
# desc:backup all database datafile in archive with rman
# connect database
# set
oracle_sid=dodo ;
connect target sys/sys;
# start backup database
run{
allocate channel c1 type disk;
backup full tag 'dbfull' format 'D:\DATABASE\RMAN\full%u_%s_%p' database
include current controlfile;
sql 'alter system archive log current';
release channel c1;
}
# end
說明:
1、 數(shù)據(jù)庫必須運(yùn)行在歸檔模式下
2、 RMAN將自動(dòng)備份數(shù)據(jù)文件,運(yùn)行可靠
3、 歸檔日志另外備份處理,但至少需要保存一次備份來的日志
4、 沒有必要用RMAN做冷備份,效果不好
以上舉例說明了數(shù)據(jù)庫的恢復(fù)案例的測試環(huán)境與部分備份測試腳本,其它的備份腳本可以根據(jù)以上腳本演變而來或在案例中加以說明。
數(shù)據(jù)庫的自動(dòng)實(shí)例將不加以說明,這里只舉例說明媒體錯(cuò)誤或人為錯(cuò)誤造成的恢復(fù)可能。
以上包括以下案例都是在Windows+Oracle9.2上測試驗(yàn)證的,在不同的操作系統(tǒng)與不同的數(shù)據(jù)庫版本中略有差別。
三、了解與恢復(fù)相關(guān)的信息
1、理解報(bào)警日志文件
報(bào)
警日志文件一般記載了數(shù)據(jù)庫的啟動(dòng)/關(guān)閉信息,歸檔信息,備份信息,恢復(fù)信息,常見錯(cuò)誤信息,部分?jǐn)?shù)據(jù)庫修改記錄等。一般令名規(guī)則
為<SID>Alrt.log或Alrt<SID>.log,如我的測試數(shù)據(jù)庫的報(bào)警日志文件的名稱為
alert_dodo.log。
報(bào)警日志文件的路徑是根據(jù)初始化參數(shù)background_dump_dest來決定的,如在我的機(jī)器上,該參數(shù)值為D:\oracle\admin\dodo\bdump,那么,你就可以在該路徑下找到該文件
2、后臺(tái)進(jìn)程跟蹤文件
后臺(tái)進(jìn)程跟蹤文件的路徑與報(bào)警日志文件的路徑一致,在某些情況下,你可以通過后臺(tái)跟蹤文件的信息了解更多的需要恢復(fù)的信息。如在數(shù)據(jù)庫需要恢復(fù)的時(shí)候,報(bào)警日志文件中常有這樣的語句:
Errors in file D:\oracle\admin\dodo\bdump\dodo_dbw0.trc:
ORA-01157: cannot identify/lock data file 1 - see DBWR trace
file
通過提示的DBWR跟蹤文件,可以查詢到更詳細(xì)的信息。
3、v$recover_file與v$recovery_log
這是兩個(gè)動(dòng)態(tài)性能視圖,可以在mount下查看,通過這兩個(gè)視圖,你可以了解詳細(xì)的需要恢復(fù)的數(shù)據(jù)文件與需要使用到的歸檔日志。
(本系列均轉(zhuǎn)自:http://www./wxqxs/archive/2008/12/14/251957.html)
|