由于工作的需要筆者有很長一段時間需要與開發(fā)人員進行溝通,并在必要時展開相關(guān)的培訓工作。在這個過程中,筆者發(fā)現(xiàn)大多數(shù)開發(fā)人員不知道MySQL的存儲 引擎概念,這可能和他們以往開發(fā)的數(shù)據(jù)庫應用如Microsoft SQL Server、Oracle、DB2等有關(guān)。而在MySQL數(shù)據(jù)庫中,存儲引擎的概念顯得尤為重要,每個存儲引擎可能面向一種特定或者最優(yōu)的數(shù)據(jù)庫應用環(huán) 境。 圖1-1顯示了MySQL數(shù)據(jù)庫的體系結(jié)構(gòu),可見MySQL數(shù)據(jù)庫由以下幾部分組成: 連接池組件(Connection Pool)。 管理服務(wù)和工具組件(Management Services &Utilities)。 SQL接口組件(SQL Interface)。 查詢分析器組件(Parser)。 優(yōu)化器組件(Optimizer)。 緩沖組件(Caches & Buffers)。 插件式存儲引擎(Pluggable Storage Engines)。 物理文件(File system)。 SQL解析器、SQL優(yōu)化器、緩沖池、存儲引擎等組件在每個數(shù)據(jù)庫中都存在,但不是每個數(shù)據(jù)庫都有這么多存儲引擎。MySQL的插件式存儲引擎 可以讓存儲引擎層的開發(fā)人員設(shè)計他們希望的存儲層,例如,有的應用需要滿足事務(wù)的要求,有的應用則不需要對事務(wù)有這么強的要求;有的希望數(shù)據(jù)能持久存儲, 有的只希望放在內(nèi)存中,臨時并快速地提供對數(shù)據(jù)的查詢。下面將介紹MySQL數(shù)據(jù)庫中一些常用的存儲引擎及它們面向的數(shù)據(jù)庫應用。 InnoDB存儲引擎: 支持事務(wù),其設(shè)計目標主要面向聯(lián)機事務(wù)處理(OLTP)的應用。其特點是行鎖設(shè)計、支持外鍵,并支持類似Oracle的非鎖定讀,即默認讀取操作不會產(chǎn)生鎖。從MySQL 5.5.8版本開始是默認的存儲引擎。 InnoDB存儲引擎將數(shù)據(jù)放在一個邏輯的表空間中,這個表空間就像黑盒一樣由InnoDB存儲引擎自身來管理。從MySQL 4.1(包括4.1)版本開始,可以將每個InnoDB存儲引擎的表單獨存放到一個獨立的ibd文件中。此外,InnoDB存儲引擎支持將裸設(shè)備(row disk)用于建立其表空間。 InnoDB通過使用多版本并發(fā)控制(MVCC)來獲得高并發(fā)性,并且實現(xiàn)了SQL標準的4種隔離級別,默認為REPEATABLE級別,同時 使用一種稱為netx-key locking的策略來避免幻讀(phantom)現(xiàn)象的產(chǎn)生。除此之外,InnoDB存儲引擎還提供了插入緩沖(insert buffer)、二次寫(double write)、自適應哈希索引(adaptive hash index)、預讀(read ahead)等高性能和高可用的功能。 對于表中數(shù)據(jù)的存儲,InnoDB存儲引擎采用了聚集(clustered)的方式,每張表都是按主鍵的順序進行存儲的,如果沒有顯式地在表定義時指定主鍵,InnoDB存儲引擎會為每一行生成一個6字節(jié)的ROWID,并以此作為主鍵。 InnoDB存儲引擎是MySQL數(shù)據(jù)庫最為常用的一種引擎,F(xiàn)acebook、Google、Yahoo等公司的成功應用已經(jīng)證明了 InnoDB存儲引擎具備高可用性、高性能以及高可擴展性。對其底層實現(xiàn)的掌握和理解也需要時間和技術(shù)的積累。如果想深入了解InnoDB存儲引擎的工作 原理、實現(xiàn)和應用,可以參考《MySQL技術(shù)內(nèi)幕:InnoDB存儲引擎》一書。 MyISAM存儲引擎: 不支持事務(wù)、表鎖設(shè)計、支持全文索引,主要面向一些OLAP數(shù)據(jù)庫應用,在MySQL 5.5.8版本之前是默認的存儲引擎(除Windows版本外)。數(shù)據(jù)庫系統(tǒng)與文件系統(tǒng)一個很大的不同在于對事務(wù)的支持, MyISAM存儲引擎是不支持事務(wù)的。究其根本,這也并不難理解。用戶在所有的應用中是否都需要事務(wù)呢?在數(shù)據(jù)倉庫中,如果沒有ETL這些操作,只是簡單 地通過報表查詢還需要事務(wù)的支持嗎?此外,MyISAM存儲引擎的另一個與眾不同的地方是,它的緩沖池只緩存(cache)索引文件,而不緩存數(shù)據(jù)文件, 這與大多數(shù)的數(shù)據(jù)庫都不相同。 NDB存儲引擎: 2003年,MySQL AB公司從Sony Ericsson公司收購了NDB 存儲引擎。NDB存儲引擎是一個集群存儲引擎,類似于Oracle的RAC集群,不過與Oracle RAC的 share everything結(jié)構(gòu)不同的是,其結(jié)構(gòu)是share nothing的集群架構(gòu),因此能提供更高級別的高可用性。NDB存儲引擎的特點是數(shù)據(jù)全部放在內(nèi)存中(從5.1版本開始,可以將非索引數(shù)據(jù)放在磁盤 上),因此主鍵查找(primary key lookups)的速度極快,并且能夠在線添加NDB數(shù)據(jù)存儲節(jié)點(data node)以便線性地提高數(shù)據(jù)庫性能。由此可見,NDB存儲引擎是高可用、高性能、高可擴展性的數(shù)據(jù)庫集群系統(tǒng),其面向的也是OLTP的數(shù)據(jù)庫應用類型。 Memory存儲引擎: 正如其名,Memory存儲引擎中的數(shù)據(jù)都存放在內(nèi)存中,數(shù)據(jù)庫重啟或發(fā)生崩潰,表中的數(shù)據(jù)都將消失。它非常適合于存儲OLTP數(shù)據(jù)庫應用中臨 時數(shù)據(jù)的臨時表,也可以作為OLAP數(shù)據(jù)庫應用中數(shù)據(jù)倉庫的維度表。Memory存儲引擎默認使用哈希索引,而不是通常熟悉的B+樹索引。 Infobright存儲引擎: 第三方的存儲引擎。其特點是存儲是按照列而非行的,因此非常適合OLAP的數(shù)據(jù)庫應用。其項目主頁是http://www./,上面有不少成功的數(shù)據(jù)倉庫案例可供分析。 NTSE存儲引擎: 網(wǎng)易公司開發(fā)的面向其內(nèi)部使用的存儲引擎。目前的版本不支持事務(wù),但提供壓縮、行級緩存等特性,不久的將來會實現(xiàn)面向內(nèi)存的事務(wù)支持。 MySQL數(shù)據(jù)庫還有很多其他存儲引擎,上述只是列舉了最為常用的一些引擎。如果你喜歡,完全可以編寫專屬于自己的引擎,這就是開源賦予我們的能力,也是開源的魅力所在。 |
|