了解MySQL(超詳細(xì)的MySQL工作原理 體系結(jié)構(gòu))
由圖,可以看出MySQL最上層是連接組件。下面服務(wù)器是由連接池、管理工具和服務(wù)、SQL接口、解析器、優(yōu)化器、緩存、存儲引擎、文件系統(tǒng)組成。
—> 連接池:由于每次建立建立需要消耗很多時間,連接池的作用就是將這些連接緩存下來,下次可以直接用已經(jīng)建立好的連接,提升服務(wù)器性能。
? —>SQL接口:接受用戶的SQL命令,并且返回用戶需要查詢的結(jié)果。比如select * from就是調(diào)用SQL Interface ? —>解析器: SQL命令傳遞到解析器的時候會被解析器驗證和解析。解析器是由Lex和YACC實現(xiàn)的,是一個很長的腳本。其功能是: a.將SQL語句分解成數(shù)據(jù)結(jié)構(gòu),并將這個結(jié)構(gòu)傳遞到后續(xù)步驟,以后SQL語句的傳遞和處理就是基于這個結(jié)構(gòu)的。 ? b.如果在分解構(gòu)成中遇到錯誤,那么就說明這個sql語句是不合理的。 ? —>優(yōu)化器:查詢優(yōu)化器,SQL語句在查詢之前會使用查詢優(yōu)化器對查詢進(jìn)行優(yōu)化。他使用的是“選取-投影-聯(lián)接”策略進(jìn)行查詢。舉一個例子: select * from users where uname='admin'; 1.這個select查詢先根據(jù)where語句進(jìn)行選取,而不是先將表全部查詢出來以后再進(jìn)行uname過濾。(選取) ? 2.這個select查詢先根據(jù)*進(jìn)行屬性投影,而不是將屬性全部取出以后再進(jìn)行過濾。(投影) ? 3.將這兩個查詢條件聯(lián)接起來生成最終查詢結(jié)果。(聯(lián)接) ? —>緩存器: 查詢緩存,如果查詢緩存有命中的查詢結(jié)果,查詢語句就可以直接去查詢緩存中取數(shù)據(jù)。通過LRU算法將數(shù)據(jù)的冷端溢出,未來得及時刷新到磁盤的數(shù)據(jù)頁,叫臟頁。這個緩存機(jī)制是由一系列小緩存組成的。比如表緩存,記錄緩存,key緩存,權(quán)限緩存等 ? 簡而言之, 服務(wù)層執(zhí)行過程:sql語句通過sql接口,服務(wù)器如果緩存cache有命中查詢結(jié)果,直接讀取數(shù)據(jù)。如果沒有命中查詢結(jié)果,由解析器進(jìn)行sql語句的解析,預(yù)處理,經(jīng)過優(yōu)化器進(jìn)行優(yōu)化后提交給引擎層。通俗地說—>服務(wù)層告訴引擎層要做什么。
創(chuàng)建新表時如果不指定存儲引擎,那么系統(tǒng)就會使用默認(rèn)存儲引擎,MySQL5.5 之前的 默認(rèn)存儲引擎是 MyISAM,5.5 之后改為了 InnoDB。 MySQL 中同一個數(shù)據(jù)庫,不同的表格可以選擇不同的存儲引擎。
全局內(nèi)存:緩沖池里面有數(shù)據(jù)緩存、索引緩存、鎖信息、插入緩存等等。此外還有重做日志緩存、額外的內(nèi)存池。線程內(nèi)存:Master Thread、IO Thread、Purage Thread、Page Cleaner Thread。 CheckPoint技術(shù):緩沖池的設(shè)計目的為了協(xié)調(diào)CPU速度與磁盤速度的鴻溝。因此跟新或者刪除的時候直接操作的是內(nèi)存的數(shù)據(jù),先寫入重做日志,然后再修改內(nèi)存池里面的數(shù)據(jù),最后定時刷新到磁盤上。 四、MySQL文件結(jié)構(gòu)
表空間可以在邏輯上管理多個數(shù)據(jù)文件,而這些數(shù)據(jù)文件又可以分布在不同磁盤中這就使得一個表的數(shù)據(jù)、索引等信息可以被記錄在多個磁盤中。 (1)共享表空間:共享表空間文件以.ibdata*來命名; 共享表空間下,innodb所有數(shù)據(jù)保存在一個單獨(dú)的表空間里面,而這個表空間可以由很多個文件組成,一個表可以跨多個文件存在,所以其大小限制不再是文件大小的限制,而是其自身的限制。從Innodb的官方文檔中可以看到,其表空間的最大限制為64TB,也就是說,Innodb的單表限制基本上也在64TB左右了,當(dāng)然這個大小是包括這個表的所有索引等其他相關(guān)數(shù)據(jù)。共享表空間主要存放double write、undo log(undo log沒有獨(dú)立的表空間,需要存放在共享表空間) (2)獨(dú)立表空間:每個表擁有自己獨(dú)立的表空間用來存儲數(shù)據(jù)和索引。 (3)查看數(shù)據(jù)庫是否啟用獨(dú)立表空間:show variables like ‘innodb_file_per_table’;查看,innodb_file_per_table=ON,表示啟用了獨(dú)立表空間; (4)使用獨(dú)立表空間的優(yōu)點:a.如果使用軟鏈接將大表分配到不同的分區(qū)上,易于管理數(shù)據(jù)文件b.易于監(jiān)控解決IO資源使用的問題;c.易于修復(fù)和恢復(fù)損壞的數(shù)據(jù);d.相互獨(dú)立的,不會影響其他innodb表;e.導(dǎo)出導(dǎo)入只針對單個表,而不是整個共享表空間;f.解決單個文件大小的限制;g.對于大量的delete操作,更易于回收磁盤空間;h.碎片較少,易于整理optimize table;i.易于安全審計;j.易于備份如果在innodb表已創(chuàng)建后設(shè)置innodb_file_per_table,那么數(shù)據(jù)將不會遷移到單獨(dú)的表空間上,而是續(xù)集使用之前的共享表空間。只有新創(chuàng)建的表才會分離到自己的表空間文件。 (5)共享表空間的數(shù)據(jù)文件配置:innodb_data_file_path參數(shù):設(shè)置innoDB共享表空間數(shù)據(jù)文件的名字和大小,例如innodb_data_file_path=ibdata1:12M:autoextend(初始大小12M,不足自增)innodb_data_home_dir參數(shù):innodb引擎的共享表空間數(shù)據(jù)文件的存放目錄目前主要是使用獨(dú)立表空間,但是共享表空間也是需要的,共享表空間主要存放double write、undo log等。 五、InnoDB表存儲結(jié)構(gòu)表空間∶表空間可看做是InnoDB存儲引擎邏輯結(jié)構(gòu)的最高層。 段 :表空間由各個段組成,常見的段有數(shù)據(jù)段、索引段、回滾段等。 區(qū) :由64個連續(xù)的頁組成,每個頁大小為16kb,即每個區(qū)大小為1MB。頁:每頁16kb,且不能更改。常見的頁類型有∶數(shù)據(jù)頁、Undo頁、系統(tǒng)頁、事務(wù)數(shù)據(jù)頁、插入緩沖位圖頁、插入緩沖空閑列表頁、未壓縮的二進(jìn)制大對象頁、壓縮的二進(jìn)制大對象頁。 行 :InnoDB存儲引擎是面向行的(row-oriented),每頁最多允許存放7992行數(shù)據(jù)。 a.每頁=16Kb(頁類型:數(shù)據(jù)頁、undo頁、系統(tǒng)頁、事務(wù)數(shù)據(jù)頁、插入緩沖位圖頁、插入緩沖空閑列表頁、未壓縮的二進(jìn)制大對象頁、壓縮的二進(jìn)制大對象頁) b.區(qū)=64個連續(xù)的頁=64*16Kb=1MB |
|