RNA測序的前世今生生 N 2005年,人類基因組計(jì)劃完成,我們以為揭開了人體2.5萬個(gè)基因、30億個(gè)堿基對的秘密,就能尋找到生命根源的奧義。然而這只是給我們打開了另一扇窗戶,開啟了后基因組研究的大門。為了了解基因產(chǎn)物的功能作用,我們需要用到轉(zhuǎn)錄組測序技術(shù),對基因表達(dá)數(shù)據(jù)進(jìn)行分析和處理。 轉(zhuǎn)錄組通常是指一個(gè)細(xì)胞中的所有轉(zhuǎn)錄本。特定發(fā)育階段或生理?xiàng)l件下,細(xì)胞內(nèi)的轉(zhuǎn)錄本可能與狀態(tài)有很大的聯(lián)系,所以我們可以通過轉(zhuǎn)錄本測序,對細(xì)胞的轉(zhuǎn)錄本進(jìn)行分析研究。例如,分析細(xì)胞編碼和非編碼的轉(zhuǎn)錄本,分析可變剪切,定位基因互作網(wǎng)絡(luò)等。然而,目前應(yīng)用最多的還是通過轉(zhuǎn)錄組研究來確定不同條件下轉(zhuǎn)錄本表達(dá)模式的改變,尋找和驗(yàn)證新的生物學(xué)指標(biāo)。 芯片技術(shù)原理與特點(diǎn) 在以前,芯片技術(shù)是基因組表達(dá)分析的中堅(jiān)力量,在這個(gè)技術(shù)最輝煌的時(shí)期,一提到研究基因表達(dá),人們就會想到使用芯片。Microarray芯片上排列著大量的核酸探針,可以包含生物的整個(gè)基因組或部分基因組,比如外顯子、miRNA、單核苷酸多態(tài)性SNP等。在體內(nèi)的基因組合成為成熟的mRNA后,我們將其提取出來,并反轉(zhuǎn)錄為cDNA,然后進(jìn)行熒光標(biāo)記。帶有熒光標(biāo)記的與cDNA芯片上的探針雜交,芯片上各點(diǎn)的信號強(qiáng)弱,代表了該探針目的基因的表達(dá)量。 芯片技術(shù)快捷、方便、簡單,能準(zhǔn)確的找到研究者需要找到的基因組信息——然而這也是芯片技術(shù)最大的局限:過于依賴已知的基因組信息。在探索性研究和非模式生物的研究中,芯片就找不到一些新的剪接點(diǎn)和突變。因此,隨著測序技術(shù)的發(fā)展,測序成本不斷下降,RNA測序?qū)⒊蔀樽罱K贏家。 測序技術(shù)的優(yōu)勢 高通量二代測序技術(shù)的流行將RNA測序技術(shù)和轉(zhuǎn)錄本分析帶入了一個(gè)新的紀(jì)元。RNA測序技術(shù)的差別之處就在于把成熟mRNA剪切后逆轉(zhuǎn)錄為cDNA文庫,然后進(jìn)行測序。這樣RNA測序技術(shù)就能做到芯片技術(shù)做不到的事情——發(fā)現(xiàn)未知的轉(zhuǎn)錄本、發(fā)現(xiàn)基因融合和遺傳多態(tài)性。在測序深度足夠的情況下,RNA測序技術(shù)在高豐度和低豐度的轉(zhuǎn)錄本檢測中都比芯片有效。 在轉(zhuǎn)錄組測序技術(shù)中,如何有效的將成熟的mRNA提取出來,是研究者們需要考慮的問題。而關(guān)鍵就是去除總RNA中的rRNA,如果殘余過多,大量短RNA會減少測序結(jié)果匹配到轉(zhuǎn)錄本的數(shù)目。根據(jù)mRNA的特點(diǎn),用多聚胸腺嘧啶寡核苷酸匹配mRNA的polyA尾,就可以將mRNA提取出來,這種方法稱為mRNA-seq?;蛘呤峭ㄟ^雜交捕獲rRNA再用磁珠吸附去除的方法,這種稱為Ribo-Zero-seq;另外還有一種利用雙鏈特異性核酸酶處理的方法提取mRNA,稱為DSN-seq。 方法比較 2014年,Wei Zhao等人在BMC Genomics上發(fā)表文章。他們使用的是來自北卡羅來納大學(xué)(UNC)和腫瘤基因組圖譜計(jì)劃(TCGA)的冰凍組織(FF)樣本和福爾馬林固定石蠟包埋(FFPE)樣本,然后針對rRNA去除效率、基因組序列匹配情況、轉(zhuǎn)錄組覆蓋度、轉(zhuǎn)錄本定量精確性和可重復(fù)性、基因表達(dá)模式和差異基因表達(dá)以及不同測序深度下注釋基因的覆蓋度等六個(gè)方面進(jìn)行討論,對mRNA-seq,Ribo-Zero-seq以及DSN-seq進(jìn)行了比較。 首先,研究者比較去除rRNA的相對水平,發(fā)現(xiàn)Ribo和mRNA-seq兩種方法的去除效率比較高,而DSN-seq的去除效率就比較低了。同樣,他們發(fā)現(xiàn)Ribo和mRNA-seq兩種方法(94.0%,93.8%)的基因組序列匹配情況要優(yōu)于DSN-seq(85.5%)。中位變異系數(shù)(CV)考察的是轉(zhuǎn)錄本平均覆蓋度的離散程度,而Ribo和mRNA-seq兩種方法的離散程度比DSN-seq的更低,說明前者轉(zhuǎn)錄本的測序結(jié)果覆蓋度更一致。比較5’端和3’端轉(zhuǎn)錄本的差異,研究者發(fā)現(xiàn)Ribo-Zero比mRNA-seq測到的差異更小,原因是Ribo-Zero不需要匹配3’端的腺苷序列。 然后,研究者探究轉(zhuǎn)錄組的覆蓋度,因?yàn)檫@一指標(biāo)直接影響轉(zhuǎn)錄本豐度測量的準(zhǔn)確度和轉(zhuǎn)錄本檢測的靈敏度,非常重要。在mRNA-seq中超過62.3%的RNA覆蓋到基因編碼區(qū),而Ribo-Zero的僅有31.5%。然而,Ribo-Zero和DSN-seq有更多的RNA覆蓋到內(nèi)含子和基因間區(qū);關(guān)注10號染色體上GATA3基因的詳細(xì)情況,發(fā)現(xiàn)Ribo-Zero和DSN-seq捕捉到了外顯子和內(nèi)含子跨區(qū)域部分,說明捕捉到了前體mRNA的信息。 系統(tǒng)聚類分析可以從整體上評估不同的檢測方法能否發(fā)現(xiàn)生物學(xué)表達(dá)的一致性和差異性。研究者檢測使用不同處理方法的相同樣本是否聚類在一起,他們用之前研究的大樣本RNA測序數(shù)據(jù)做聚類分析,發(fā)現(xiàn)在不同的RNA處理方法中,大部分樣本都按照相同樣本聚類到一起了。差異表達(dá)分析發(fā)現(xiàn)410個(gè)基因的表達(dá)量差異,而且Ribo-Zero-seq在有更多的核仁小RNA和組蛋白RNA。 和芯片雜交相比,每個(gè)樣本的測序花費(fèi)仍然高昂,雖然多路技術(shù)可以有效降低成本,但這種技術(shù)也會降低檢測低表達(dá)基因的能力。因此,研究者比較了不同方法檢測到相同的轉(zhuǎn)錄本所需的最低測序深度。通過比較得出,只有DSN-seq的FFPE樣本需要明顯更大的測序深度。 mRNA-seq、Ribo-Zero-seq、DSN-seq還有microarray的方法各有所長,各有側(cè)重,比如mRNA-seq更側(cè)重于外顯子區(qū)域,而Ribo-Zero-seq更側(cè)重于內(nèi)含子區(qū)域等。我們需要針對不同的研究目的,采用不同的處理方法,才能保證實(shí)驗(yàn)的準(zhǔn)確無誤。 |
|