編寫:WB小能手 lncRNA芯片分析的基本步驟 1. 歸一化lncRNA芯片采用的歸一化的方法為quantile normalization。 2. 差異LncRNA的篩選lncRNA芯片中既有l(wèi)ncRNA的探針又有mRNA的探針,分別做差異基因的篩選,篩選方法同表達譜的篩選方法是一致的,參見表達譜的差異基因篩選。 3. 差異lncRNA的重注釋lncRNA芯片注釋不完善,因此需要將篩選出來的lncRNA進行重注釋。將差異lncRNA在基因組上位置上下游延伸,以尋找lncRNA附近的有功能的基因。 4. 差異lncRNA靶基因的預測lncRNA可能通過調控相應的mRNA發(fā)揮功能,因此有必要預測lncRNA的靶基因。我們提取差異lncRNA和mRNA的序列,首先用blast進行初篩,之后用RNAplex進行進一步篩選,以預測lncRNA可能調控的mRNA。 5. 差異lncRNA與靶基因共表達網絡預測出lncRNA的靶基因后,并可進一步在mRNA的數據中探尋該mRNA是否發(fā)生表達量的變化。由此構建差異lncRNA與靶基因相互作用網絡圖。 6. 差異lncRNA與差異mRNA的共表達分析SBC Human lncRNA芯片能同時檢測出差異表達的lncRNA和mRNA。我們將差異lncRNA和差異mRNA在一組樣品中進行共表達分析,可以發(fā)現與某個lncRNA具有相同表達模式的mRNA。 樣本數據要求:每組數據3個或3個以上生物學重復 實驗組:對照組: 7. 差異lncRNA靶基因的GO analysis對lncRNA的靶基因進行GO Ontology的生物學的分類,根據Fisher's Exact Test,得到p-value,得到lncRNA靶基因對應的顯著性功能,從而了解lncRNA的功能。 8. 差異lncRNA靶基因的pathway analysis對lncRNA靶基因按照Pathway的主要公共數據庫KEGG和Biocarta來進行分類,對Pathway中的基因進行基于離散分布的顯著性分析,得到與實驗目的有顯著聯(lián)系的Pathway 分類,由這些pathway對應相應的靶基因,從而獲得該分類即導致lncRNA差異的最重要Pathway。 9. 差異lncRNA的轉錄因子的預測提取lncRNA TSS的上游2000bp,下游500bp,利用HMM的算法根據TRANSFAC8.1數據庫預測其轉錄因子。 10. lncRNA cis作用機制研究:對于感興趣的差異表達lncRNAs,搜索其上下游100K范圍內的所有編碼基因,并與該lncRNAs 有顯著共表達的基因取交集。這些在基因組上臨近、且表達模式上共表達的基因很可能被該lncRNAs 所調控。 11. lncRNA trans作用機制研究:計算LncRNAs 共表達的編碼基因,集合與轉錄因子/染色質調控復合物的靶基因集合的交集,利用超幾何分布計算該交集的富集程度,得到與lncRNAs 顯著相關的轉錄因子,從而識別可能與lncRNAs 聯(lián)合發(fā)揮調控作用的轉錄因子/染色質調控因子。 ---------介紹--------- 長鏈非編碼RNA(lncRNA) lncRNA長鏈非編碼RNA(long noncoding RNA,lncRNA)是一類不編碼蛋白的RNA 分子,長度在200bp 以上,起初被認為是RNA 聚合酶II 轉錄的副產物,不具有生物學功能;近期的研究表明lncRNA 具有保守的二級結構,可以與蛋白、DNA 和RNA 相互作用,參與多種生物學過程的調控,尤其在腫瘤當中發(fā)揮了重要的調控角色,如染色質修飾、轉錄激活和抑制、轉錄后調解以及作為miRNA 的誘導分子干擾基因的表達等。 隨著高通量測序技術的發(fā)展,越來越多的lncRNA 被注釋,但是絕大多數的lncRNA 的功能仍然不清楚,因此lncRNA 的研究是一片非常廣闊的未知領域,具有極大的研究價值和意義。 為何細胞不惜耗費能量對這些非編碼RNA的表達和定位進行嚴格調控呢?這些RNA分析究竟有何功能?RNA測序技術的發(fā)展使人們得以初窺這一神秘分子,現在lncRNA的許多相關信息都可以再新數據庫中查到,例如Broad研究所、哈佛大學和麻省理工共同開發(fā)的Human Body Map lincRNAs catalog。雖然近年來關于lncRNA的研究進展迅猛,但是現在人們了解到的lncRNA只是冰山一角,絕大部分的lncRNA的功能仍然是不清楚的。隨著研究的推進,各類lncRNA的大量發(fā)現,lncRNA的研究作為RNA研究的新領域,已經成為一個非常吸引人的方向,有待廣大科學家去探尋。lncRNA研究當前面臨的一個主要挑戰(zhàn)是,研究工具還在不斷開發(fā)和改進中,而lncRNA研究中非常關鍵的一步就是發(fā)現與特定疾病相關的lncRNA?,F階段,基因芯片技術發(fā)展趨于成熟穩(wěn)定,在此平臺上,通過設計不同檢測lncRNA探針篩選lncRNA是一種準確快捷的方法。lncRNA特征lncRNA通常較長,具有mRNA樣結構,有些具有poly(A)尾巴,有些沒有poly(A)尾巴,分化過程中有動態(tài)的表達與不同的剪接方式,與編碼基因相比,lncRNA表達量更低。 ※ 組織特異性:不同組織之間的lncRNA表達量不同。 ※ 時空特異性:同一組織或器官的不同生長階段,其中的lncRNA表達量也會變化。 ※ lncRNA啟動子同樣可以結合轉錄因子,如Oct3/4,Nanog,CREB,Sp1,c-myc,Sox2與p53,局部染色質組蛋白同樣具有特征性的修飾方式與結構特征。 ※ 大多數的lncRNA在組織分化發(fā)育過程中,都具有明顯的時空表達特異性,如有人針對小鼠的1300個lncRNA進行研究,發(fā)現在腦組織中的不同部位,lncRNA具有不同的表達模式?!?在腫瘤與其他疾病中有特征性的表達方式。 ※ lncRNA的亞細胞位置上也呈多樣化,在細胞核、細胞質和細胞器均有分布,甚至某些lncRNA具有獨特的亞細胞位置,有可能是全新的亞細胞構成。 lncRNA功能 lncRNA可從染色質重塑、轉錄調控及轉錄后加工等多種層面實現對基因表達的調控:a) lncRNA通過招募染色質重塑復合物至特定的基因組位點使其發(fā)生催化活性。如HOTAIR21,Xist、RepA和Kcnqot1招募Polycomb complex至HoxD位點,使得X染色體或Kcnq1功能域的組蛋白H3 第27位賴氨酸發(fā)生3甲基化(me3K27),誘導異染色質形成,從而抑制該區(qū)域基因表達。b) lncRNA通過多種機制進行轉錄水平調控。lncRNA結合到基因cyclin D1上,招募RNA結合蛋白TLS來調控蛋白CBP和p300的組蛋白乙酰轉移酶活性,進而抑制cyclin D1轉錄。c) 超保守增強子轉錄出lncRNA-Evf2,該lncRNA能激活轉錄因子DLX2,進而調控基因Dlx6轉錄。d) DHFR次要啟動子區(qū)域轉錄出的lncRNA與該基因主要啟動子區(qū)域結合形成三聚體,抑制轉錄因子TFIID結合,從而使基因DHFR發(fā)生沉默。e) 反義lncRNA能夠與剪接體(splicesome)中鋅指同源mRNA Zeb2的5'剪切位點結合,使內含子未被剪切掉,而該內含子序列中保留有內部核糖體進入位點(IRE位點),翻譯過程中識別并結合該位點,導致Zeb2基因表達和翻譯。 lncRNA分子機制隨著lncRNA功能逐步顯現,其與靶點的作用機制成為進一步的熱點。 早期認為原位調控是LncRNA作用的唯一機制,它通過招募形成染色質修飾復合物而沉默鄰近基因轉錄,例如IGF2R反義RNA(antisense of IGF2RRNA,AIR)、XIST等。而Hox基因反義基因間RNA(Hox antisense intergenic RNA,HOTAIR)的發(fā)現提示LncRNA可能存在遠程調控。同源異型基因(homeotic genes,HOX)在細胞增殖與定向分化中起關鍵作用,人類Hox基因簇約含100個ncRNA基因,其中HOTAIR定位于HOXC基因座12q13.13。HOTAIR的5'端可招募結合多梳蛋白抑制復合物2(polycomb repressive complex2,PRC2),借助PRC2上三個H3K27甲基化酶EZH2、SUZ12和EED,使另一基因座HOXD上長約40kb的序列轉錄沉默,從而在乳腺上皮細胞內使細胞內轉錄傾向于胚胎成纖維細胞樣表型。超過20%的LncRNA能夠通過結合PRC2或其他類似復合物發(fā)揮作用,提示LncRNA的遠程調控機制在生物體內廣泛存在。 其作用機制如上圖所示,主要包括以下幾種情況: 1) 在編碼蛋白基因的上游啟動子區(qū)(橘色)轉錄,從而干擾鄰近蛋白編碼基因(藍色)的表達(如酵母SER3基因); 2) 抑制RNA 聚合酶Ⅱ,或介導染色質重構和組蛋白修飾,而影響基因(藍色)表達; 3) lncRNA(紫色)與編碼蛋白基因的轉錄本形成互補雙鏈,干擾mRNA的剪切,進而產生不同的剪切形式; 4) lncRNA(紫色)與編碼蛋白基因的轉錄本形成互補雙鏈,在Dicer酶作用下產生內源性的siRNA,調控基因的表達水平; 5) lncRNA(綠色)結合在特定蛋白質上調節(jié)相應蛋白的活性; 6) 作為結構組分與蛋白質形成核酸蛋白質復合體; 7) 結合在特定蛋白上從而改變該蛋白的胞質定位; 8) 可作為小分子RNA(如miRNA)的前體分子。 科研可以是一種快樂 關注基金申請、聚焦科研熱點、解讀實驗難點 |
|