作者:解螺旋. 麥子 解螺旋原創(chuàng) 轉(zhuǎn)載請注明來源:解螺旋,醫(yī)生科研助手 隨著高通量測序和許多科學家的深入研究,大家越來越熟知非編碼RNA(ncRNAs)的流弊功能,目前它們是:生物標注物的主要來源;潛在的疾病治療靶標;全基因組關(guān)聯(lián)研究(GWAS)中非編碼突變功能的潛在解釋。當然這也是小伙伴們寫標書啊、文章啊、暢談項目時候眼中閃閃有光的原因所在。 ncRNAs中風頭正勁的非lncRNAs莫屬,很多人都想分一杯羹,但是要入門,在最初查找文獻資料的時候許多人卻發(fā)現(xiàn),lncRNA咋那么多種類?。科鋵嵱捎趌ncRNA大家爭相研究的年代還不是很久遠,所以難免名字啊、類型啊一堆亂象,Cell子刊《Trends in Genetics》發(fā)表題為“The Landscape of long noncoding RNA classification”的綜述,探討了lncRNA分類上的種種問題。 現(xiàn)有l(wèi)ncRNAs種類的標準和特點 絕大多數(shù)lncRNAs的類型都依賴于最初用于檢測它們的經(jīng)驗屬性,這反應(yīng)了它們相對于編碼蛋白的基因,短暫的研究歷史還沒有沉淀出統(tǒng)一的標準,科學家起初看到這種無特征RNA物種(也沒想到日后人家輝煌騰達了),只是怎么方便怎么就命名或者歸類了。 不同類型ncRNAs示意圖 1根據(jù)轉(zhuǎn)錄產(chǎn)物長度這種方法最常用,超過200個堿基就能區(qū)分ncRNAs的長短了。通過總RNA的RNA-seq圖譜,科學家發(fā)現(xiàn)基因間區(qū)域編碼了多達長千上萬的一類非常長的ncRNAs(vlincRNAs),初始轉(zhuǎn)錄產(chǎn)物可以長達50 kb-1 Mb,跨越至少10%的人類基因組。vlincRNAs在多能性、癌癥、細胞凋亡、細胞周期進展和細胞衰老等生物過程中都有重要作用。 2根據(jù)相關(guān)蛋白編碼基因的相關(guān)性基于cDNA末端快速擴增(RACE)和RNA-seq這兩種有針對性的方法,我們已經(jīng)知道轉(zhuǎn)錄森林構(gòu)成了人類基因組的一般特征。一類著名的lncRNAs就是正義鏈與編碼的mRNA在同一條鏈上重疊,共享一段序列,但不編碼蛋白。這類包括未拼接正義鏈的部分固有RNAs(PINs),以及來自基因編碼和非編碼區(qū)包含外顯子的拼接產(chǎn)物。GENCODE承認在“正義鏈重疊”中存在這樣拼接的lncRNAs。 一個蛋白編碼基因可以完全由內(nèi)含子轉(zhuǎn)錄產(chǎn)生lncRNAs,這被稱作TINs(totally intronic RNAs)。TINs占了所有核內(nèi)non-rRNA的70%,整個細胞內(nèi)non-rRNA的40-50%。這些RNAs參與維持間期染色質(zhì)構(gòu)型,大部分都會涉及長鏈3’UTRs轉(zhuǎn)錄產(chǎn)物拼接。 3根據(jù)功能lncRNAs可以參與大量不同的細胞過程:染色質(zhì)重塑、調(diào)節(jié)轉(zhuǎn)錄和翻譯、RNA穩(wěn)定、細胞支架和先天免疫等。ncRNA-a是一類具有增強子特性的lncRNA,可以正調(diào)控附近的基因。這一類中的一個著名成員是ncRNA-a7,可以調(diào)控Snail轉(zhuǎn)錄因子。另一個例子是競爭性內(nèi)源RNA(ceRNAs),它們與編碼蛋白的轉(zhuǎn)錄本共享一段序列,可以競爭性結(jié)合其調(diào)控的分子從而發(fā)揮功能。還有一些lncRNAs可以作為更短的功能性RNA如miRNAs、piwiRNAs的前體。 4根據(jù)和其他已知功能DNA元件的相關(guān)性這類RNAs包括與增強子和啟動子相關(guān)的長鏈RNAs,它們涉及細胞核結(jié)構(gòu)的動態(tài)連接、染色質(zhì)信號可塑性和轉(zhuǎn)錄調(diào)控。 5根據(jù)與mRNA的相似之處由GENCODE注釋的lncRNAs,即使是那些僅僅來源于內(nèi)含子的序列,主要代表著拼接的轉(zhuǎn)錄本。這些特征被用來確定小鼠和人體內(nèi)成千上萬個轉(zhuǎn)錄本,被稱作長鏈干擾ncRNAs(lincRNAs)。該方法揭示了許多重要功能lncRNAs,比如HOTAIR,它可以促進表觀遺傳的抑制因子PRC2定位到靶位點來介導基因沉默。研究人員通過對1300例人類腫瘤樣本microarray分析發(fā)現(xiàn),成百上千個lincRNAs的表達異常可能與四種不同類型的腫瘤相關(guān)。 其他分類方式還包括: √ 根據(jù)序列重復次數(shù) √ 根據(jù)一個生物化學通路或穩(wěn)定性 √ 根據(jù)測序或者結(jié)構(gòu)保守程度 √ 根據(jù)生理狀態(tài) √ 根據(jù)亞細胞定位 雖然特定lncRNAs功能性的證據(jù)繼續(xù)積累,但是不一致、混亂不清和重疊的術(shù)語帶來了歧義,并使這個領(lǐng)域通常不夠明晰。缺乏基本的概念明確的分類框架,致使非編碼轉(zhuǎn)錄組數(shù)據(jù)的注釋和解釋都受到了諸多挑戰(zhàn)。它也可能會破壞為闡明lncRNA功能的新基因組方法和數(shù)據(jù)庫的整合。 參考文獻:The Landscape of long noncoding RNA classification(回復“長鏈”下載原文)
|
|