Oracle數(shù)據(jù)庫設(shè)計開發(fā)階段性能優(yōu)化策略
摘 要 通過對Oracle 數(shù)據(jù)庫系統(tǒng)物理結(jié)構(gòu)和邏輯結(jié)構(gòu)的分析,闡述了在Oralce數(shù)據(jù)庫設(shè)計開發(fā)階段性能優(yōu)化的一些策略和方法。
關(guān)鍵詞 Oracle 數(shù)據(jù)庫 性能優(yōu)化 策略
引言
Oracle是目前使用最為廣泛的大型數(shù)據(jù)庫管理系統(tǒng),提高Oracle數(shù)據(jù)庫系統(tǒng)的運行效率,是整個計算機信息系統(tǒng)高效運轉(zhuǎn)的前提和保證。影響Oracle數(shù)據(jù)庫應(yīng)用系統(tǒng)性能的因素很多,既有軟件方面的因素,也包括數(shù)據(jù)運行的硬件環(huán)境、網(wǎng)絡(luò)環(huán)境、數(shù)據(jù)庫管理和維護方面的因素等。數(shù)據(jù)庫系統(tǒng)設(shè)計開發(fā)階段是Oracle應(yīng)用優(yōu)化的最佳階段,也是主動優(yōu)化階段,能達(dá)到以最小成本獲得最大性能增益的目的。通過對其邏輯存儲結(jié)構(gòu)和物理存儲結(jié)構(gòu)設(shè)計進行優(yōu)化,使之在滿足需求條件下,時空開銷性能最佳,可以解決數(shù)據(jù)庫系統(tǒng)運行過程中性能的漸進性下降或性能突降等問題,以保證系統(tǒng)運行的優(yōu)良性能。
Oracle數(shù)據(jù)庫的邏輯結(jié)構(gòu)和物理結(jié)構(gòu)
Oracle 數(shù)據(jù)庫的邏輯結(jié)構(gòu)是由一些數(shù)據(jù)庫對象組成,如數(shù)據(jù)庫表空間、表、索引、段、視圖、存儲過程、觸發(fā)器等。數(shù)據(jù)庫的邏輯存儲結(jié)構(gòu)(表空間等)決定了數(shù)據(jù)庫的物理空間是如何被使用的,數(shù)據(jù)庫對象如表、索引等分布在各個表空間中。
Oracle 數(shù)據(jù)庫的物理結(jié)構(gòu)從操作系統(tǒng)一級查看,是由一個個的文件組成,從物理上可劃分為:數(shù)據(jù)文件、日志文件、控制文件和參數(shù)文件。數(shù)據(jù)文件中存放了所有的數(shù)據(jù)信息;日志文件存放數(shù)據(jù)庫運行期間產(chǎn)生的日志信息,它被重復(fù)覆蓋使用,若不采用歸檔方式的話,已被覆蓋的日志信息將無法恢復(fù);控制文件記錄了整個數(shù)據(jù)庫的關(guān)鍵結(jié)構(gòu)信息,它若被破壞,整個數(shù)據(jù)庫將無法工作和恢復(fù);參數(shù)文件中設(shè)置了很多Oracle 數(shù)據(jù)庫的配置參數(shù),當(dāng)數(shù)據(jù)庫啟動時,會讀取這些信息。
邏輯結(jié)構(gòu)的優(yōu)化
邏輯結(jié)構(gòu)優(yōu)化用通俗的話來說就是通過增加、減少或調(diào)整邏輯結(jié)構(gòu)來提高應(yīng)用的效率,下面通過對基本表的設(shè)計及索引、聚簇的討論來分析ORACLE邏輯結(jié)構(gòu)的優(yōu)化。
1、基本表擴展
數(shù)據(jù)庫性能包括存儲空間需求量的大小和查詢響應(yīng)時間的長短兩個方面。為了優(yōu)化數(shù)據(jù)庫性能,需要對數(shù)據(jù)庫中的表進行規(guī)范化。一般來說,邏輯數(shù)據(jù)庫設(shè)計滿足第三范式的表結(jié)構(gòu)容易維護且基本滿足實際應(yīng)用的要求。所以,實際應(yīng)用中一般都按照第三范式的標(biāo)準(zhǔn)進行規(guī)范化,從而保證了數(shù)據(jù)庫的一致性和完整性,設(shè)計人員往往會設(shè)計過多的表間關(guān)聯(lián),以盡可能地降低數(shù)據(jù)冗余。但在實際應(yīng)用中這種做法有時不利于系統(tǒng)運行性能的優(yōu)化:如過程從多表獲取數(shù)據(jù)時引發(fā)大量的連接操作,在需要部分?jǐn)?shù)據(jù)時要掃描整個表等,這都消耗了磁盤的I/O 和CPU 時間。
為解決這一問題,在設(shè)計表時應(yīng)同時考慮對某些表進行反規(guī)范化,方法有以下幾種:一是分割表。分割表可分為水平分割表和垂直分割表兩種:水平分割是按照行將一個表分割為多個表,這可以提高每個表的查詢速度,但查詢、更新時要選擇不同的表,統(tǒng)計時要匯總多個表,因此應(yīng)用程序會更復(fù)雜。垂直分割是對于一個列很多的表,若某些列的訪問頻率遠(yuǎn)遠(yuǎn)高于其它列,就可以將主鍵和這些列作為一個表,將主鍵和其它列作為另外一個表。通過減少列的寬度,增加了每個數(shù)據(jù)頁的行數(shù),一次I/O就可以掃描更多的行,從而提高了訪問每一個表的速度。但是由于造成了多表連接,所以應(yīng)該在同時查詢或更新不同分割表中的列的情況比較少的情況下使用。二是保留冗余列。當(dāng)兩個或多個表在查詢中經(jīng)常需要連接時,可以在其中一個表上增加若干冗余的列,以避免表之間的連接過于頻繁,一般在冗余列的數(shù)據(jù)不經(jīng)常變動的情況下使用。三是增加派生列。派生列是由表中的其它多個列的計算所得,增加派生列可以減少統(tǒng)計運算,在數(shù)據(jù)匯總時可以大大縮短運算時間。
因此,在數(shù)據(jù)庫的設(shè)計中,數(shù)據(jù)應(yīng)當(dāng)按兩種類別進行組織:頻繁訪問的數(shù)據(jù)和頻繁修改的數(shù)據(jù)。對于頻繁訪問但是不頻繁修改的數(shù)據(jù),內(nèi)部設(shè)計應(yīng)當(dāng)物理不規(guī)范化。對于頻繁修改但并不頻繁訪問的數(shù)據(jù),內(nèi)部設(shè)計應(yīng)當(dāng)物理規(guī)范化。有時還需將規(guī)范化的表作為邏輯數(shù)據(jù)庫設(shè)計的基礎(chǔ),然后再根據(jù)整個應(yīng)用系統(tǒng)的需要,物理地非規(guī)范化數(shù)據(jù)。規(guī)范與反規(guī)范都是建立在實際的操作基礎(chǔ)之上的約束,脫離了實際兩者都沒有意義。只有把兩者合理地結(jié)合在一起,才能相互補充,發(fā)揮各自的優(yōu)點。
2、索引和聚簇
創(chuàng)建索引是提高檢索效率最有效的方法之一,索引把表中的邏輯值映射到安全的RowID,能快速定位數(shù)據(jù)的物理地址,可以大大加快數(shù)據(jù)庫的查詢速度,一個建有合理索引的數(shù)據(jù)庫應(yīng)用系統(tǒng)可能比一個沒有建立索引的數(shù)據(jù)庫應(yīng)用系統(tǒng)效率高幾十倍,但并不是索引越多越好,在那些經(jīng)常需要修改的數(shù)據(jù)列上建立索引,將導(dǎo)致索引B*樹的不斷重組,造成系統(tǒng)性能的下降和存儲空間的浪費。對于一個大型表建立的索引,有時并不能改善數(shù)據(jù)查詢速度,反而會影響整個數(shù)據(jù)庫的性能。這主要是和SGA的數(shù)據(jù)管理方式有關(guān),Oracle在進行數(shù)據(jù)塊高速緩存管理時,索引數(shù)據(jù)比普通數(shù)據(jù)具有更高的駐留權(quán)限,在進行空間競爭時, Oracle會先移出普通數(shù)據(jù),對建有索引的大型表進行數(shù)據(jù)查詢時,索引數(shù)據(jù)可能會用完所有的數(shù)據(jù)塊緩存空間,Oracle不得不頻繁地進行磁盤讀寫來獲取數(shù)據(jù),所以,在對一個大型表進行分區(qū)之后,可以根據(jù)相應(yīng)的分區(qū)建立分區(qū)索引。
Oracle提供了另一種方法來提高查詢速度,就是聚簇(Cluster)。所謂聚簇,簡單地說就是把幾個表放在一起,按一定公共屬性混合存放。聚簇根據(jù)共同碼值將多個表的數(shù)據(jù)存儲在同一個Oracle塊中,這時檢索一組Oracle塊就同時得到兩個表的數(shù)據(jù),這樣就可以減少需要存儲的 Oracle塊,從而提高應(yīng)用程序的性能。
對于邏輯結(jié)構(gòu)的優(yōu)化,還應(yīng)將表數(shù)據(jù)和索引數(shù)據(jù)分開表空間存儲,分別使用獨立的表空間。因為如果將表數(shù)據(jù)和索引數(shù)據(jù)放在一起,表數(shù)據(jù)的I/O操作和索引的I/O操作將產(chǎn)生影響系統(tǒng)性能的I/O競爭,降低系統(tǒng)的響應(yīng)效率。將表數(shù)據(jù)和索引數(shù)據(jù)存放在不同的表空間中,并在物理層面將這兩個表空間的數(shù)據(jù)文件放在不同的物理磁盤上,就可以避免這種競爭了。
物理結(jié)構(gòu)的優(yōu)化
數(shù)據(jù)庫的數(shù)據(jù)最終是存儲在物理磁盤上的,對數(shù)據(jù)進行訪問就是對這些物理磁盤進行讀寫,因此對于這些物理存儲的優(yōu)化是系統(tǒng)優(yōu)化的一個重要部分。對于物理存儲結(jié)構(gòu)優(yōu)化,主要是合理地分配邏輯結(jié)構(gòu)的物理存儲地址,這樣雖不能減少對物理存儲的讀寫次數(shù),但卻可以使這些讀寫盡量并行,減少磁盤讀寫競爭,從而提高效率,也可以通過對物理存儲進行精密的計算減少不必要的物理存儲結(jié)構(gòu)擴充,從而提高系統(tǒng)利用率。
1、磁盤讀寫并行優(yōu)化
對于數(shù)據(jù)庫的物理讀寫,Oracle系統(tǒng)本身會進行盡可能的并行優(yōu)化,例如在一個最簡單的表檢索操作中,如果表結(jié)構(gòu)和檢索域上的索引不在一個物理結(jié)構(gòu)上,那么在檢索的過程中,對索引的檢索和對表的檢索就是并行進行的。
2、操作并行優(yōu)化
操作并行的優(yōu)化是基于操作語句的統(tǒng)計結(jié)果,首先是統(tǒng)計各個表的訪問頻率,表之間的連接頻率,根據(jù)這些數(shù)據(jù)按如下原則分配表空間和物理磁盤,減少系統(tǒng)進程和用戶進程的磁盤I/O競爭;把需要連接的表格在表空間/物理磁盤上分開;把高頻訪問的表格在表空間/物理磁盤上分開;把經(jīng)常需要進行檢索的表格的表結(jié)構(gòu)和索引在表空間/物理磁盤上分開。
3、減少存儲結(jié)構(gòu)擴展
如果應(yīng)用系統(tǒng)的數(shù)據(jù)庫比較脆弱,并在不斷地增長或縮小,這樣的系統(tǒng)在非動態(tài)變化周期內(nèi)效率合理,但是當(dāng)在動態(tài)變化周期內(nèi)的時候,性能卻很差,這是由于Oracle的動態(tài)擴展造成的。在動態(tài)擴張的過程中,Oracle必須根據(jù)存儲的要求,在創(chuàng)建行、行變化獲取缺省值時,擴展和分配新的存儲空間,而且表格的擴展往往并不是事情的終結(jié),還可能導(dǎo)致數(shù)據(jù)文件、表空間的增長,這些擴展會導(dǎo)致在線系統(tǒng)反應(yīng)緩慢。對于這樣的系統(tǒng),最好的辦法就是在建立的時候預(yù)先分配足夠的大小和合適的增長幅度。在一個對象建立的時候要根據(jù)應(yīng)用充分地計算他們的大小,然后再根據(jù)這些數(shù)據(jù)來定義對象Initial、Next和 Minextents的值,使數(shù)據(jù)庫在物理存儲上和動態(tài)增長次數(shù)上達(dá)到一個比較好的平衡點,使這些對象既不經(jīng)常發(fā)生增長,也不過多地占用數(shù)據(jù)庫。
結(jié)論
優(yōu)化Oracle 數(shù)據(jù)庫對提高計算機系統(tǒng)的可用性和效率,具有非常重要的意義, 特別是在Oracle數(shù)據(jù)庫設(shè)計開發(fā)階段,對邏輯結(jié)構(gòu)和物理結(jié)構(gòu)進行有效的優(yōu)化設(shè)計,創(chuàng)建一個規(guī)劃布局合理的數(shù)據(jù)庫,可以獲得最小的系統(tǒng)開銷,能從根本上大大提高應(yīng)用系統(tǒng)的整體性能,對于以后的數(shù)據(jù)庫性能調(diào)整和利用都有很大的益處。
|