數(shù)據(jù)存儲技術(shù)應(yīng)用詳解:RAID工作模式【IT168專稿】信息時代的核心無疑是信息技術(shù),而信息技術(shù)的核心則在于信息的處理與存儲。隨著數(shù)據(jù)量的劇增,數(shù)據(jù)存儲技術(shù)已經(jīng)面臨著巨大的挑戰(zhàn)。數(shù)據(jù)存儲技術(shù)方案主要有DAS(Direct Attached Storage)、NAS(Network Attached Storage)和SAN(Storage Area Network)?;诓煌臄?shù)據(jù)存儲技術(shù)方案主要的應(yīng)用有文件存儲系統(tǒng)和數(shù)據(jù)庫系統(tǒng)。本文主要探討一下數(shù)據(jù)庫系統(tǒng)基于不同數(shù)據(jù)存儲技術(shù)方案的應(yīng)用,以便于加深了解不同的數(shù)據(jù)存儲技術(shù)方案在不同領(lǐng)域中的應(yīng)用。 隨著人們對信息技術(shù)的依賴度越來越高,對數(shù)據(jù)的安全性要求也就越來越高,一旦不慎丟失關(guān)鍵數(shù)據(jù),可能會造成不可估量的損失,輕則辛苦積累起來的心血付之東流,嚴重的會影響企業(yè)的正常運作,給科研、生產(chǎn)造成巨大的損失。因此對數(shù)據(jù)的備份至關(guān)重要。 1. 數(shù)據(jù)存儲技術(shù)方案 數(shù)據(jù)存儲和存儲管理技術(shù)最早起源于70年代的終端/主機的計算模式,當時由于數(shù)據(jù)集中在主機上,因此連接在主機上的硬盤和磁帶是當時主要的存儲和備份的設(shè)備。80年代以后,由于個人電腦的發(fā)展,尤其是客戶機/服務(wù)器模式的出現(xiàn),使得數(shù)據(jù)存儲分布化。此時網(wǎng)絡(luò)上文件服務(wù)器和數(shù)據(jù)庫服務(wù)器往往是重要數(shù)據(jù)集中的地方。而客戶機上也有一定量的數(shù)據(jù),數(shù)據(jù)的分布造成數(shù)據(jù)存儲管理的復(fù)雜化。而九十年代Internet的迅猛發(fā)展,也使得存儲技術(shù)發(fā)生著革命性的變化。這種變化主要表現(xiàn)在三個方面:首先是存儲容量的急劇膨脹,從而對于存儲服務(wù)器提出了更大的需求;其次是數(shù)據(jù)持續(xù)時間的增加。今天Internet使網(wǎng)絡(luò)數(shù)據(jù)必須保證每天24小時,每周7天,每年365天處于可獲得狀態(tài)。最后對數(shù)據(jù)存儲的管理提出了更高的要求。數(shù)據(jù)的多樣化,地理上的分散性,對重要數(shù)據(jù)的保護等等都對數(shù)據(jù)管理提出了更高的要求。面對這些變化,出現(xiàn)了網(wǎng)絡(luò)存儲(比如NAS和SAN),將存儲設(shè)備從應(yīng)用服務(wù)器中分離出來,進行集中管理。 ?。?)DAS存儲技術(shù)方案 DAS(Direct Attached Storage-直接附加存儲)是傳統(tǒng)的數(shù)據(jù)存儲技術(shù)方案,即服務(wù)器直接通過SCSI卡或HBA卡連接磁盤陣列。該方案采用總線結(jié)構(gòu),而非網(wǎng)格結(jié)構(gòu),使用該傳統(tǒng)數(shù)據(jù)存儲技術(shù)方案主要有高數(shù)據(jù)傳輸率、低延遲、高可靠性等特性。但是可擴展性不夠,可連接設(shè)備受到限制,增加容量時需要停機等缺點。其示意圖如下:
?。?) NAS存儲技術(shù)方案 NAS(Network Attached Storage-網(wǎng)絡(luò)連接存儲)即將存儲設(shè)備通過標準的網(wǎng)絡(luò)拓撲結(jié)構(gòu)(例如以太網(wǎng)),連接到一群計算機上。NAS是以文件方式進行數(shù)據(jù)傳輸,通過網(wǎng)絡(luò)映射硬盤提供存儲空間。采用這種數(shù)據(jù)存儲技術(shù)方案主要有可擴展性好,可以在不間斷網(wǎng)絡(luò)運行的情況下增加或設(shè)備存儲,降低了網(wǎng)絡(luò)主機的負擔,便于安裝,降低購買和維護成本。但是采用NAS有個明顯的缺陷,就是將DAS中數(shù)據(jù)傳輸?shù)钠款i由控制卡轉(zhuǎn)移到局域網(wǎng)上來了,也就是說在存儲的局域網(wǎng)中除了必須處理正常的最終用戶傳輸流外,還必須處理包括備份操作的存儲磁盤請求。其示意圖如下: 數(shù)據(jù)存儲技術(shù)應(yīng)用詳解:RAID工作模式【IT168專稿】信息時代的核心無疑是信息技術(shù),而信息技術(shù)的核心則在于信息的處理與存儲。隨著數(shù)據(jù)量的劇增,數(shù)據(jù)存儲技術(shù)已經(jīng)面臨著巨大的挑戰(zhàn)。數(shù)據(jù)存儲技術(shù)方案主要有DAS(Direct Attached Storage)、NAS(Network Attached Storage)和SAN(Storage Area Network)?;诓煌臄?shù)據(jù)存儲技術(shù)方案主要的應(yīng)用有文件存儲系統(tǒng)和數(shù)據(jù)庫系統(tǒng)。本文主要探討一下數(shù)據(jù)庫系統(tǒng)基于不同數(shù)據(jù)存儲技術(shù)方案的應(yīng)用,以便于加深了解不同的數(shù)據(jù)存儲技術(shù)方案在不同領(lǐng)域中的應(yīng)用。 隨著人們對信息技術(shù)的依賴度越來越高,對數(shù)據(jù)的安全性要求也就越來越高,一旦不慎丟失關(guān)鍵數(shù)據(jù),可能會造成不可估量的損失,輕則辛苦積累起來的心血付之東流,嚴重的會影響企業(yè)的正常運作,給科研、生產(chǎn)造成巨大的損失。因此對數(shù)據(jù)的備份至關(guān)重要。 1. 數(shù)據(jù)存儲技術(shù)方案 數(shù)據(jù)存儲和存儲管理技術(shù)最早起源于70年代的終端/主機的計算模式,當時由于數(shù)據(jù)集中在主機上,因此連接在主機上的硬盤和磁帶是當時主要的存儲和備份的設(shè)備。80年代以后,由于個人電腦的發(fā)展,尤其是客戶機/服務(wù)器模式的出現(xiàn),使得數(shù)據(jù)存儲分布化。此時網(wǎng)絡(luò)上文件服務(wù)器和數(shù)據(jù)庫服務(wù)器往往是重要數(shù)據(jù)集中的地方。而客戶機上也有一定量的數(shù)據(jù),數(shù)據(jù)的分布造成數(shù)據(jù)存儲管理的復(fù)雜化。而九十年代Internet的迅猛發(fā)展,也使得存儲技術(shù)發(fā)生著革命性的變化。這種變化主要表現(xiàn)在三個方面:首先是存儲容量的急劇膨脹,從而對于存儲服務(wù)器提出了更大的需求;其次是數(shù)據(jù)持續(xù)時間的增加。今天Internet使網(wǎng)絡(luò)數(shù)據(jù)必須保證每天24小時,每周7天,每年365天處于可獲得狀態(tài)。最后對數(shù)據(jù)存儲的管理提出了更高的要求。數(shù)據(jù)的多樣化,地理上的分散性,對重要數(shù)據(jù)的保護等等都對數(shù)據(jù)管理提出了更高的要求。面對這些變化,出現(xiàn)了網(wǎng)絡(luò)存儲(比如NAS和SAN),將存儲設(shè)備從應(yīng)用服務(wù)器中分離出來,進行集中管理。 ?。?)DAS存儲技術(shù)方案 DAS(Direct Attached Storage-直接附加存儲)是傳統(tǒng)的數(shù)據(jù)存儲技術(shù)方案,即服務(wù)器直接通過SCSI卡或HBA卡連接磁盤陣列。該方案采用總線結(jié)構(gòu),而非網(wǎng)格結(jié)構(gòu),使用該傳統(tǒng)數(shù)據(jù)存儲技術(shù)方案主要有高數(shù)據(jù)傳輸率、低延遲、高可靠性等特性。但是可擴展性不夠,可連接設(shè)備受到限制,增加容量時需要停機等缺點。其示意圖如下:
?。?) NAS存儲技術(shù)方案 NAS(Network Attached Storage-網(wǎng)絡(luò)連接存儲)即將存儲設(shè)備通過標準的網(wǎng)絡(luò)拓撲結(jié)構(gòu)(例如以太網(wǎng)),連接到一群計算機上。NAS是以文件方式進行數(shù)據(jù)傳輸,通過網(wǎng)絡(luò)映射硬盤提供存儲空間。采用這種數(shù)據(jù)存儲技術(shù)方案主要有可擴展性好,可以在不間斷網(wǎng)絡(luò)運行的情況下增加或設(shè)備存儲,降低了網(wǎng)絡(luò)主機的負擔,便于安裝,降低購買和維護成本。但是采用NAS有個明顯的缺陷,就是將DAS中數(shù)據(jù)傳輸?shù)钠款i由控制卡轉(zhuǎn)移到局域網(wǎng)上來了,也就是說在存儲的局域網(wǎng)中除了必須處理正常的最終用戶傳輸流外,還必須處理包括備份操作的存儲磁盤請求。其示意圖如下:
RAID-3使用一個專門的磁盤存放所有的校驗數(shù)據(jù),而在剩余的磁盤中創(chuàng)建帶區(qū)集分散數(shù)據(jù)的讀寫操作。當一個完好的RAID-3系統(tǒng)中讀取數(shù)據(jù),只需要在數(shù)據(jù)存儲盤中找到相應(yīng)的數(shù)據(jù)塊進行讀取操作即可。但當向RAID-3寫入數(shù)據(jù)時,必須計算與該數(shù)據(jù)塊同處一個帶區(qū)的所有數(shù)據(jù)塊的校驗值,并將新值重新寫入到校驗塊中,這樣無形雖增加系統(tǒng)開銷。當一塊磁盤失效時,該磁盤上的所有數(shù)據(jù)塊必須使用校驗信息重新建立,如果所要讀取的數(shù)據(jù)塊正好位于已經(jīng)損壞的磁盤,則必須同時讀取同一帶區(qū)中的所有其它數(shù)據(jù)塊,并根據(jù)校驗值重建丟失的數(shù)據(jù),這使系統(tǒng)減慢。當更換了損壞的磁盤后,系統(tǒng)必須一個數(shù)據(jù)塊一個數(shù)據(jù)塊的重建壞盤中的數(shù)據(jù),整個系統(tǒng)的性能會受到嚴重的影響。RAID-3最大不足是校驗盤很容易成為整個系統(tǒng)的瓶頸,對于經(jīng)常大量寫入操作的應(yīng)用會導(dǎo)致整個RAID系統(tǒng)性能的下降。
?。?) RAID-5工作模式 RAID-5把校驗塊分散到所有的數(shù)據(jù)盤中。RAID-5使用了一種特殊的算法,可以計算出任何一個帶區(qū)校驗塊的存放位置。這樣就可以確保任何對校驗塊進行的讀寫操作都會在所有的RAID磁盤中進行均衡,從而消除了產(chǎn)生瓶頸的可能。RAID-5的讀出效率很高,寫入效率一般,塊式的集體訪問效率不錯。所以RAID-5更適合于小數(shù)據(jù)塊隨機讀寫的數(shù)據(jù)。RAID-5提高了系統(tǒng)可靠性,但對數(shù)據(jù)傳輸?shù)牟⑿行越鉀Q不好,而且控制器的設(shè)計也相當困難。
(5)RAID-1+0工作模式 把RAID-0和RAID-1技術(shù)結(jié)合起來,數(shù)據(jù)除分布在多個盤上外,每個盤都有其物理鏡像盤,提供全冗余能力,允許一個以下磁盤故障,而不影響數(shù)據(jù)可用性,并具有快速讀/寫能力。RAID-1+0要在磁盤鏡像中建立帶區(qū)集至少4個硬盤。
綜上所述,RAID-1+0是最昂貴的一個磁盤劃分方案,但是其容災(zāi)能力很強,并且讀寫效率也還不錯。RAID-0是效率最高的磁盤劃分方案,但是其容災(zāi)能力卻因為沒有冗余處理,所以最低。RAID-5則介于RAID-0和RAID-1之間,即保證了數(shù)據(jù)容災(zāi)能力,又提供了對數(shù)據(jù)較好的讀寫處理能力。但是其讀寫和容災(zāi)效率也是介于這兩種方案之間。RAID-3對隨機數(shù)據(jù)的寫性能損失較大,并且災(zāi)錯時對系統(tǒng)的性能影響也較大。 因此對于數(shù)據(jù)庫來說,如果是OLTP(Online Transaction Processing-聯(lián)機事務(wù)處理)系統(tǒng),則采用RAID-5磁盤劃分方案。因為OLTP系統(tǒng)的數(shù)據(jù)塊一般都比較小,隨機性比較強,但是數(shù)據(jù)量卻不大,而且對數(shù)據(jù)還有一定的容災(zāi)要求,所以采用RAID-5磁盤劃分方案比較合適。如果是OLAP(Online Analytical Processing-聯(lián)機分析處理)系統(tǒng),則采用RAID-1+0磁盤劃分方案。因為OLAP系統(tǒng)對數(shù)據(jù)的容災(zāi)能力要求比較高,一般都是大數(shù)據(jù)量的連續(xù)讀寫操作,并且數(shù)據(jù)量也比較大。所以采用RAID-1+0磁盤劃分方案比較合適。 ▲ |
|
來自: qrzhcd > 《硬件設(shè)備》