【寫在前面的話】:首先,這一篇博文中的內(nèi)容并非原創(chuàng),而是對多篇文獻中內(nèi)容的直接摘錄,有些圖片和資料還來自身邊的同事(在此深表謝意?。?,再夾雜自己的零星想法,寫在這里分享與大家,同時也是為了方便自己日后若有需要能夠方便獲得,文章比較長。 摘要:從1977年第一代DNA測序技術(shù)(Sanger法)1,發(fā)展至今三十多年時間,測序技術(shù)已取得了相當大的發(fā)展,從第一代到第三代乃至第四代,測序讀長從長到短,再從短到長。雖然就當前形勢看來第二代短讀長測序技術(shù)在全球測序市場上仍然占有著絕對的優(yōu)勢位置,但第三和第四代測序技術(shù)也已在這一兩年的時間中快速發(fā)展著。測序技術(shù)的每一次變革,也都對基因組研究,疾病醫(yī)療研究,藥物研發(fā),育種等領(lǐng)域產(chǎn)生巨大的推動作用。在這里我主要對當前的測序技術(shù)以及它們的測序原理做一個簡單的小結(jié)。 圖1:測序技術(shù)的發(fā)展歷程 生命體遺傳信息的快速獲得對于生命科學的研究有著十分重要的意義。以上(圖1)所描述的是自沃森和克里克在1953年建立DNA雙螺旋結(jié)構(gòu)以來,整個測序技術(shù)的發(fā)展歷程。 第一代測序技術(shù) 第一代DNA測序技術(shù)用的是1975年由桑格(Sanger)和考爾森(Coulson)開創(chuàng)的鏈終止法或者是1976-1977年由馬克西姆(Maxam)和吉爾伯特(Gilbert)發(fā)明的化學法(鏈降解). 并在1977年,桑格測定了第一個基因組序列,是噬菌體X174的,全長5375個堿基1。自此,人類獲得了窺探生命遺傳差異本質(zhì)的能力,并以此為開端步入基因組學時代。研究人員在Sanger法的多年實踐之中不斷對其進行改進。在2001年,完成的首個人類基因組圖譜就是以改進了的Sanger法為其測序基礎(chǔ),Sanger法核心原理是:由于ddNTP的2’和3’都不含羥基,其在DNA的合成過程中不能形成磷酸二酯鍵,因此可以用來中斷DNA合成反應,在4個DNA合成反應體系中分別加入一定比例帶有放射性同位素標記的ddNTP(分為:ddATP,ddCTP,ddGTP和ddTTP),通過凝膠電泳和放射自顯影后可以根據(jù)電泳帶的位置確定待測分子的DNA序列(圖2)。這個網(wǎng)址為sanger測序法制作了一個小短片,形象而生動。 值得注意的是,就在測序技術(shù)起步發(fā)展的這一時期中,除了Sanger法之外還出現(xiàn)了一些其他的測序技術(shù),如焦磷酸測序法、鏈接酶法等。其中,焦磷酸測序法是后來Roche公司454技術(shù)所使用的測序方法2–4,而連接酶測序法是后來ABI公司SOLID技術(shù)使用的測序方法2,4,但他們的共同核心手段都是利用了Sanger1中的可中斷DNA合成反應的dNTP。
圖2:Sanger法測序原理 第二代測序技術(shù) 總的說來,第一代測序技術(shù)的主要特點是測序讀長可達1000bp,準確性高達99.999%,但其測序成本高,通量低等方面的缺點,嚴重影響了其真正大規(guī)模的應用。因而第一代測序技術(shù)并不是最理想的測序方法。經(jīng)過不斷的技術(shù)開發(fā)和改進,以Roche公司的454技術(shù)、illumina公司的Solexa,Hiseq技術(shù)和ABI公司的Solid技術(shù)為標記的第二代測序技術(shù)誕生了。第二代測序技術(shù)大大降低了測序成本的同時,還大幅提高了測序速度,并且保持了高準確性,以前完成一個人類基因組的測序需要3年時間,而使用二代測序技術(shù)則僅僅需要1周,但在序列讀長方面比起第一代測序技術(shù)則要短很多。表1和圖3對第一代和第二代測序技術(shù)各自的特點以及測序成本作了一個簡單的比較5,以下我將對這三種主要的第二代測序技術(shù)的主要原理和特點作一個簡單的介紹。
圖3. 測序成本的變化
Illumina公司的Solexa和Hiseq應該說是目前全球使用量最大的第二代測序機器,這兩個系列的技術(shù)核心原理是相同的2,4。這兩個系列的機器采用的都是邊合成邊測序的方法,它的測序過程主要分為以下4步,如圖4. (1)DNA待測文庫構(gòu)建 利用超聲波把待測的DNA樣本打斷成小片段,目前除了組裝之外和一些其他的特殊要求之外,主要是打斷成200-500bp長的序列片段,并在這些小片段的兩端添加上不同的接頭,構(gòu)建出單鏈DNA文庫。 (2)Flowcell Flowcell是用于吸附流動DNA片段的槽道,當文庫建好后,這些文庫中的DNA在通過flowcell的時候會隨機附著在flowcell表面的channel上。每個Flowcell有8個channel,每個channel的表面都附有很多接頭,這些接頭能和建庫過程中加在DNA片段兩端的接頭相互配對(這就是為什么flowcell能吸附建庫后的DNA的原因),并能支持DNA在其表面進行橋式PCR的擴增。 (3)橋式PCR擴增與變性 橋式PCR以Flowcell表面所固定的接頭為模板,進行橋形擴增,如圖4.a所示。經(jīng)過不斷的擴增和變性循環(huán),最終每個DNA片段都將在各自的位置上集中成束,每一個束都含有單個DNA模板的很多分拷貝,進行這一過程的目的在于實現(xiàn)將堿基的信號強度放大,以達到測序所需的信號要求。 (4)測序 測序方法采用邊合成邊測序的方法。向反應體系中同時添加DNA聚合酶、接頭引物和帶有堿基特異熒光標記的4中dNTP(如同Sanger測序法)。這些dNTP的3’-OH被化學方法所保護,因而每次只能添加一個dNTP。在dNTP被添加到合成鏈上后,所有未使用的游離dNTP和DNA聚合酶會被洗脫掉。接著,再加入激發(fā)熒光所需的緩沖液,用激光激發(fā)熒光信號,并有光學設(shè)備完成熒光信號的記錄,最后利用計算機分析將光學信號轉(zhuǎn)化為測序堿基。這樣熒光信號記錄完成后,再加入化學試劑淬滅熒光信號并去除dNTP 3’-OH保護基團,以便能進行下一輪的測序反應。Illumina的這種測序技術(shù)每次只添加一個dNTP的特點能夠很好的地解決同聚物長度的準確測量問題,它的主要測序錯誤來源是堿基的替換,目前它的測序錯誤率在1%-1.5%之間,測序周期以人類基因組重測序為例,30x測序深度大約為1周。
圖4. Illumina測序流程
Roche 454測序系統(tǒng)是第一個商業(yè)化運營二代測序技術(shù)的平臺。它的主要測序原理是(圖5 abc)2: (1)DNA文庫制備 454測序系統(tǒng)的文件構(gòu)建方式和illumina的不同,它是利用噴霧法將待測DNA打斷成300-800bp長的小片段,并在片段兩端加上不同的接頭,或?qū)⒋郎yDNA變性后用雜交引物進行PCR擴增,連接載體,構(gòu)建單鏈DNA文庫(圖5a)。 (2)Emulsion PCR (乳液PCR,其實是一個注水到油的獨特過程) 454當然DNA擴增過程也和illumina的截然不同,它將這些單鏈DNA結(jié)合在水油包被的直徑約28um的磁珠上,并在其上面孵育、退火。 乳液PCR最大的特點是可以形成數(shù)目龐大的獨立反應空間以進行DNA擴增。其關(guān)鍵技術(shù)是“注水到油”(水包油),基本過程是在PCR反應前,將包含PCR所有反應成分的水溶液注入到高速旋轉(zhuǎn)的礦物油表面,水溶液瞬間形成無數(shù)個被礦物油包裹的小水滴。這些小水滴就構(gòu)成了獨立的PCR反應空間。理想狀態(tài)下,每個小水滴只含一個DNA模板和一個磁珠。 這些被小水滴包被的磁珠表面含有與接頭互補的DNA序列,因此這些單鏈DNA序列能夠特異地結(jié)合在磁珠上。同時孵育體系中含有PCR反應試劑,所以保證了每個與磁珠結(jié)合的小片段都能獨立進行PCR擴增,并且擴增產(chǎn)物仍可以結(jié)合到磁珠上。當反應完成后,可以破壞孵育體系并將帶有DNA的磁珠富集下來。進過擴增,每個小片段都將被擴增約100萬倍,從而達到下一步測序所要求的DNA量。 (3)焦磷酸測序 測序前需要先用一種聚合酶和單鏈結(jié)合蛋白處理帶有DNA的磁珠,接著將磁珠放在一種PTP平板上。這種平板上特制有許多直徑約為44um的小孔,每個小孔僅能容納一個磁珠,通過這種方法來固定每個磁珠的位置,以便檢測接下來的測序反應過程。 測序方法采用焦磷酸測序法,將一種比PTP板上小孔直徑更小的磁珠放入小孔中,啟動測序反應。測序反應以磁珠上大量擴增出的單鏈DNA為模板,每次反應加入一種dNTP進行合成反應。如果dNTP能與待測序列配對,則會在合成后釋放焦磷酸基團。釋放的焦磷酸基團會與反應體系中的ATP硫酸化學酶反應生成ATP。生成的ATP和熒光素酶共同氧化使測序反應中的熒光素分子并發(fā)出熒光,同時由PTP板另一側(cè)的CCD照相機記錄,最后通過計算機進行光信號處理而獲得最終的測序結(jié)果。由于每一種dNTP在反應中產(chǎn)生的熒光顏色不同,因此可以根據(jù)熒光的顏色來判斷被測分子的序列。反應結(jié)束后,游離的dNTP會在雙磷酸酶的作用下降解ATP,從而導致熒光淬滅,以便使測序反應進入下一個循環(huán)。由于454測序技術(shù)中,每個測序反應都在PTP板上獨立的小孔中進行,因而能大大降低相互間的干擾和測序偏差。454技術(shù)最大的優(yōu)勢在于其能獲得較長的測序讀長,當前454技術(shù)的平均讀長可達400bp,并且454技術(shù)和illumina的Solexa和Hiseq技術(shù)不同,它最主要的一個缺點是無法準確測量同聚物的長度,如當序列中存在類似于PolyA的情況時,測序反應會一次加入多個T,而所加入的T的個數(shù)只能通過熒光強度推測獲得,這就有可能導致結(jié)果不準確。也正是由于這一原因,454技術(shù)會在測序過程中引入插入和缺失的測序錯誤。
圖5. Roche 454測序流程
Solid測序技術(shù)是ABI公司于2007年開始投入用于商業(yè)測序應用的儀器。它基于連接酶法,即利用DNA連接酶在連接過程之中測序(圖6)2,4。它的原理是:
圖6-a. Solid測序技術(shù) (1)DNA文庫構(gòu)建 片段打斷并在片段兩端加上測序接頭,連接載體,構(gòu)建單鏈DNA文庫。 (2)Emulsion PCR Solid的PCR過程也和454的方法類似,同樣采用小水滴emulsion PCR,但這些微珠比起454系統(tǒng)來說則要小得多,只有1um。在擴增的同時對擴增產(chǎn)物的3’端進行修飾,這是為下一步的測序過程作的準備。3’修飾的微珠會被沉積在一塊玻片上。在微珠上樣的過程中,沉積小室將每張玻片分成1個、4個或8個測序區(qū)域(圖6-a)。Solid系統(tǒng)最大的優(yōu)點就是每張玻片能容納比454更高密度的微珠,在同一系統(tǒng)中輕松實現(xiàn)更高的通量。 (3)連接酶測序 這一步是Solid測序的獨特之處。它并沒有采用以前測序時所常用的DNA聚合酶,而是采用了連接酶。Solid連接反應的底物是8堿基單鏈熒光探針混合物,這里將其簡單表示為:3’-XXnnnzzz-5’。連接反應中,這些探針按照堿基互補規(guī)則與單鏈DNA模板鏈配對。探針的5’末端分別標記了CY5、Texas Red、CY3、6-FAM這4種顏色的熒光染料(圖6-a)。這個8堿基單鏈熒光探針中,第1和第2位堿基(XX)上的堿基是確定的,并根據(jù)種類的不同在6-8位(zzz)上加上了不同的熒光標記。這是Solid的獨特測序法,兩個堿基確定一個熒光信號,相當于一次能決定兩個堿基。這種測序方法也稱之為兩堿基測序法。當熒光探針能夠與DNA模板鏈配對而連接上時,就會發(fā)出代表第1,2位堿基的熒光信號,圖6-a和圖6-b中的比色版所表示的是第1,2位堿基的不同組合與熒光顏色的關(guān)系。在記錄下熒光信號后,通過化學方法在第5和第6位堿基之間進行切割,這樣就能移除熒光信號,以便進行下一個位置的測序。不過值得注意的是,通過這種測序方法,每次測序的位置都相差5位。即第一次是第1、2位,第二次是第6、7位……在測到末尾后,要將新合成的鏈變性,洗脫。接著用引物n-1進行第二輪測序。引物n-1與引物n的區(qū)別是,二者在與接頭配對的位置上相差一個堿基(圖6-a. 8)。也即是,通過引物n-1在引物n的基礎(chǔ)上將測序位置往3’端移動一個堿基位置,因而就能測定第0、1位和第5、6位……第二輪測序完成,依此類推,直至第五輪測序,最終可以完成所有位置的堿基測序,并且每個位置的堿基均被檢測了兩次。該技術(shù)的讀長在2×50bp,后續(xù)序列拼接同樣比較復雜。由于雙次檢測,這一技術(shù)的原始測序準確性高達99.94%,而15x覆蓋率時的準確性更是達到了99.999%,應該說是目前第二代測序技術(shù)中準確性最高的了。但在熒光解碼階段,鑒于其是雙堿基確定一個熒光信號,因而一旦發(fā)生錯誤就容易產(chǎn)生連鎖的解碼錯誤。
圖6-b. Solid測序技術(shù) 第三代測序技術(shù) 測序技術(shù)在近兩三年中又有新的里程碑。以PacBio公司的SMRT和Oxford Nanopore Technologies納米孔單分子測序技術(shù),被稱之為第三代測序技術(shù)。與前兩代相比,他們最大的特點就是單分子測序,測序過程無需進行PCR擴增。 其中PacBio SMRT技術(shù)其實也應用了邊合成邊測序的思想5,并以SMRT芯片為測序載體?;驹硎牵?DNA聚合酶和模板結(jié)合,4色熒光標記 4 種堿基(即是dNTP),在堿基配對階段,不同堿基的加入,會發(fā)出不同光,根據(jù)光的波長與峰值可判斷進入的堿基類型。同時這個 DNA 聚合酶是實現(xiàn)超長讀長的關(guān)鍵之一,讀長主要跟酶的活性保持有關(guān),它主要受激光對其造成的損傷所影響。PacBio SMRT技術(shù)的一個關(guān)鍵是怎樣將反應信號與周圍游離堿基的強大熒光背景區(qū)別出來。他們利用的是ZMW(零模波導孔)原理:如同微波爐壁上可看到的很多密集小孔。小孔直徑有考究,如果直徑大于微波波長,能量就會在衍射效應的作用下穿透面板而泄露出來,從而與周圍小孔相互干擾。如果孔徑小于波長,能量不會輻射到周圍,而是保持直線狀態(tài)(光衍射的原理),從而可起保護作用。同理,在一個反應管(SMRTCell:單分子實時反應孔)中有許多這樣的圓形納米小孔, 即 ZMW(零模波導孔),外徑 100多納米,比檢測激光波長小(數(shù)百納米),激光從底部打上去后不能穿透小孔進入上方溶液區(qū),能量被限制在一個小范圍(體積20X 10-21 L)里,正好足夠覆蓋需要檢測的部分,使得信號僅來自這個小反應區(qū)域,孔外過多游離核苷酸單體依然留在黑暗中,從而實現(xiàn)將背景降到最低。另外,可以通過檢測相鄰兩個堿基之間的測序時間,來檢測一些堿基修飾情況,既如果堿基存在修飾,則通過聚合酶時的速度會減慢,相鄰兩峰之間的距離增大,可以通過這個來之間檢測甲基化等信息(圖7)。SMRT技術(shù)的測序速度很快,每秒約10個dNTP。但是,同時其測序錯誤率比較高(這幾乎是目前單分子測序技術(shù)的通?。?,達到15%,但好在它的出錯是隨機的,并不會像第二代測序技術(shù)那樣存在測序錯誤的偏向,因而可以通過多次測序來進行有效的糾錯。
圖7.PacBio SMRT測序原理 Oxford Nanopore Technologies公司所開發(fā)的納米單分子測序技術(shù)與以往的測序技術(shù)皆不同,它是基于電信號而不是光信號的測序技術(shù)5。該技術(shù)的關(guān)鍵之一是,他們設(shè)計了一種特殊的納米孔,孔內(nèi)共價結(jié)合有分子接頭。當DNA堿基通過納米孔時,它們使電荷發(fā)生變化,從而短暫地影響流過納米孔的電流強度(每種堿基所影響的電流變化幅度是不同的),靈敏的電子設(shè)備檢測到這些變化從而鑒定所通過的堿基(圖8)。 該公司在去年基因組生物學技術(shù)進展年會(AGBT)上推出第一款商業(yè)化的納米孔測序儀,引起了科學界的極大關(guān)注。納米孔測序(和其他第三代測序技術(shù))有望解決目前測序平臺的不足,納米孔測序的主要特點是:讀長很長,大約在幾十kb,甚至100 kb;錯誤率目前介于1%至4%,且是隨機錯誤,而不是聚集在讀取的兩端;數(shù)據(jù)可實時讀取;通量很高(30x人類基因組有望在一天內(nèi)完成);起始DNA在測序過程中不被破壞;以及樣品制備簡單又便宜。理論上,它也能直接測序RNA。 納米孔單分子測序計算還有另一大特點,它能夠直接讀取出甲基化的胞嘧啶,而不必像傳統(tǒng)方法那樣對基因組進行bisulfite處理。這對于在基因組水平直接研究表觀遺傳相關(guān)現(xiàn)象有極大的幫助。并且改方法的測序準確性可達99.8%,而且一旦發(fā)現(xiàn)測序錯誤也能較容易地進行糾正。但目前似乎還沒有應用該技術(shù)的相關(guān)報道。
圖8. 納米孔測序 其他測序技術(shù) 目前還有一種基于半導體芯片的新一代革命性測序技術(shù)——Ion Torrent6。該技術(shù)使用了一種布滿小孔的高密度半導體芯片, 一個小孔就是一個測序反應池。當DNA聚合酶把核苷酸聚合到延伸中的DNA鏈上時,會釋放出一個氫離子,反應池中的PH發(fā)生改變,位于池下的離子感受器感受到H+離子信號,H+離子信號再直接轉(zhuǎn)化為數(shù)字信號,從而讀出DNA序列(圖9)。這一技術(shù)的發(fā)明人同時也是454測序技術(shù)的發(fā)明人之一——Jonathan Rothberg,它的文庫和樣本制備跟454技術(shù)很像,甚至可以說就是454的翻版,只是測序過程中不是通過檢測焦磷酸熒光顯色,而是通過檢測H+信號的變化來獲得序列堿基信息。Ion Torrent相比于其他測序技術(shù)來說,不需要昂貴的物理成像等設(shè)備,因此,成本相對來說會低,體積也會比較小,同時操作也要更為簡單,速度也相當快速,除了2天文庫制作時間,整個上機測序可在2-3.5小時內(nèi)完成,不過整個芯片的通量并不高,目前是10G左右,但非常適合小基因組和外顯子驗證的測序。 圖9. Ion Torrent 小結(jié) 以上,對各代測序技術(shù)的原理做了簡要的闡述,這三代測序技術(shù)的特點比較匯總在以下表1和表2中。其中測序成本,讀長和通量是評估該測序技術(shù)先進與否的三個重要指標。第一代和第二代測序技術(shù)除了通量和成本上的差異之外,其測序核心原理(除Solid是邊連接邊測序之外)都是基于邊合成邊測序的思想。第二代測序技術(shù)的優(yōu)點是成本較之一代大大下降,通量大大提升,但缺點是所引入PCR過程會在一定程度上增加測序的錯誤率,并且具有系統(tǒng)偏向性,同時讀長也比較短。第三代測序技術(shù)是為了解決第二代所存在的缺點而開發(fā)的,它的根本特點是單分子測序,不需要任何PCR的過程,這是為了能有效避免因PCR偏向性而導致的系統(tǒng)錯誤,同時提高讀長,并要保持二代技術(shù)的高通量,低成本的優(yōu)點。 表1:測序技術(shù)的比較
表2:主流測序機器的成本測序比較 以下圖10展示了當前全球測序儀的分布情況。圖中的幾個熱點區(qū)主要分布在中國的深圳(主要是華大),南歐,西歐和美國。 圖10. 測序儀全球分布http:///# 參考文獻
轉(zhuǎn)自: http://blog.csdn.net/dyllove98/article/details/9736441 |
|