作者:天昊生物
環(huán)狀RNA (circRNA)是一類具有封閉環(huán)狀結(jié)構(gòu),并且不易降解的RNA分子。雖然第一個circRNA早在40多年前就被發(fā)現(xiàn)的,但是人們對它的大規(guī)模研究卻是近十幾年的事情。
今年7月剛剛在Wiley Interdiscip Rev RNA上發(fā)表的綜述性文章“A 360o view of circular RNAs: From biogenesis to functions”,就詳細總結(jié)了環(huán)狀RNA的生物發(fā)生和功能等研究進展況。
前言
由于大多數(shù)真核基因是以分段的方式排列的,新生轉(zhuǎn)錄本通常需要被剪接,去掉非編碼內(nèi)含子后,使得外顯子彼此結(jié)合。人們早已認識到,基因表達中的這一步驟受到高度調(diào)控,利用這種機制可以從特定基因中產(chǎn)生多種mRNAs,每個成熟的亞型可以具有獨特的功能、定位模式或調(diào)節(jié)作用。在人類基因組中,95 %以上的基因是具有可變剪接的,它們通常由順式調(diào)節(jié)元件和反式作用因子共同調(diào)控。這其中,除了產(chǎn)生各種線性mRNA之外,許多真核基因也產(chǎn)生出具有末端共價連接的環(huán)狀RNA。
通過名為反向剪接(backsplices)的剪接機制,mRNA前體被剪切后,其剪切供體會連接到上游剪切受體上,例如圖1中外顯子2的末端連接到外顯子2的起始段,便會形成circRNA。盡管第一個circRNA早在40多年前就被鑒定出來,但這些轉(zhuǎn)錄本在細胞中基本上被認為是非常罕見的,所以長期被人們忽略。近期研究表明,多數(shù)circRNA較難產(chǎn)生,并且積累水平較低,但有些表達水平比相關(guān)的線性mRNA都高10倍,這也暗示一些蛋白質(zhì)編碼基因的主要功能可能是產(chǎn)生circRNA,而不是線性mRNAs或蛋白質(zhì)。
圖1、mRNA前體可以通過選擇性剪接產(chǎn)生線性mRNA或者circRNA。如果mRNA前體剪接位點(ss)以線性順序連接,則產(chǎn)生成熟的線性mRNA,成功的被加帽和多聚腺苷酸化?;蛘?,mRNA前體通過“backsplices”的剪接機制,使得5’ ss與其上游3’ ss剪接受體結(jié)合,從而產(chǎn)生末端由3’-5’磷酸二酯鍵共價連接的circRNA
本文重點回顧了過去幾年來在揭示細胞中存在的circRNA多樣性方面取得的巨大研究進展,并討論這些轉(zhuǎn)錄本是如何生成、調(diào)控和發(fā)揮功能的。
對circRNA的早期認識
circRNA最早是在1976年人們研究類病毒(viroids)如何作為植物病原體發(fā)揮作用時被發(fā)現(xiàn)的。以前已知類病毒與病毒相似之處在于它們具有傳染性和致病性,但尚不清楚類病毒是如何起作用的,因為它們看起來是相當(dāng)小的RNA (<400 nt),并且沒有蛋白質(zhì)外殼的保護。通過對純化的類病毒RNA分子研究,S?nger等人證明類病毒RNA無法對其3’端和5’端進行標(biāo)記,也無法被蛇毒磷酸二酯酶降解。電子顯微鏡結(jié)果顯示類病毒RNA結(jié)構(gòu)上呈現(xiàn)一種單鏈環(huán)的形狀。隨后Gross等人1978年發(fā)表在Nature上的文章,對類病毒進行了測序并證明它們確實是真正的circRNA。之后在circRNA領(lǐng)域雖然取得了一些成果,但直到20世紀90年代人們才成功鑒定出高等真核生物中表達的第一個內(nèi)源性circRNA。Nigro等人通過對一個腫瘤抑制基因-結(jié)直腸癌缺失基因(DCC)幾個異常剪接轉(zhuǎn)錄本的分析,發(fā)現(xiàn)在一些轉(zhuǎn)錄本中,外顯子3似乎位于外顯子2的上游,這些被打亂的轉(zhuǎn)錄本似乎沒有被聚腺苷酸化,但為正常剪接DCC轉(zhuǎn)錄本表達量的約1/1000。隨后對人ETS-1也有類似的研究,發(fā)現(xiàn)了高度穩(wěn)定的circRNA(半衰期>48 h)。
之后研究也證明circRNA可以是某些蛋白質(zhì)編碼基因的主要輸出形式,并且對小鼠Sry基因的研究提出了關(guān)于如何選擇特定外顯子進行環(huán)狀化的第一個機制見解,即在Sry外顯子旁的內(nèi)含子中存在約50kb的近乎完全互補的序列,可以形成circRNA,暗示這些側(cè)翼序列可能能夠彼此堿基配對,從而將剪接供體定位在靠近其上游剪接受體的位置,并有利于反向剪接。與該模型一致,利用質(zhì)粒實驗也顯示細胞中Sry外顯子的環(huán)化確實需要存在兩個反向重復(fù)。在使用核提取物檢測體外反向剪接時,同樣顯示內(nèi)含子反向重復(fù)促進了circRNA的產(chǎn)生,特別是當(dāng)外顯子尺寸增加時。這些體外實驗進一步有力地表明,circRNA是由剪接體產(chǎn)生的,但反向剪接可能比典型剪接反應(yīng)效率低100倍以上。在隨后的幾年中,又發(fā)現(xiàn)了一些內(nèi)源性circRNA,并發(fā)現(xiàn)外顯子跳躍和反向剪接有時緊密相連。直到后來高通量RNA-seq方法的興起,circRNA的廣泛而重要的作用才被揭示出來。
高通量測序技術(shù)引發(fā)circRNA研究的興起
大約從10年前開始,許多研究者開始使用RNA-seq來表征“完整”轉(zhuǎn)錄組,來鑒定各種先前未標(biāo)記的剪接變體和非編碼RNA。然而,這些初步分析遺漏了circRNA。這在很大程度上是由于兩個原因?qū)е拢阂皇窃谖膸熘苽浞桨钢袕V泛使用了poly(A)富集步驟,從而丟失了circRNA和缺乏poly(A)尾巴的其他轉(zhuǎn)錄本信息;二是使用了要求RNA-seq讀數(shù)以線性方式與基因組對齊的計算算法,從而導(dǎo)致以反向剪接方式連接的所有reads被丟棄。直到Salzman等人在2012年利用RNA-seq試圖識別由染色體重排引起的癌癥特異轉(zhuǎn)錄本時,才意外的發(fā)現(xiàn)了成千上萬在細胞中表達的circRNA。在這項研究中,他們從白血病細胞中鑒定出數(shù)百個外顯子順序混亂的轉(zhuǎn)錄本,但令人驚訝的是,這些轉(zhuǎn)錄本絕大多數(shù)也在正常細胞中觀察到。這表明這些異常的RNA不是由于基因組DNA的結(jié)構(gòu)重排,而是由于在所有細胞中活躍的剪接過程造成的。它們同樣缺少poly(A),并且對消化幾乎所有線性RNAs的RNase R具有抗性。
隨后的RNA-seq研究證實了這些初步觀察,并鑒定了數(shù)以千計的circRNA,這些circRNA是從包括后生動物、植物、真菌和原生動物在內(nèi)的各種真核生物的蛋白質(zhì)編碼基因中產(chǎn)生的。這些假定的circRNA中的許多已經(jīng)被收錄到幾個在線數(shù)據(jù)庫中,包括circBase、CIRCpedia和CircInteractome。一般來說,在給定的細胞類型中,可以從超過10%的表達基因中檢測到circRNA,并且circRNA的水平與其相應(yīng)的mRNA之間通常沒有明確的相關(guān)性。大多數(shù)circRNA是組織特異性的,表達水平較低,但也有一些在多個物種中表達較高,并且有數(shù)百個基因以比標(biāo)準線性mRNA更高的水平表達。這在神經(jīng)系統(tǒng)尤其如此。例如,在果蠅中,90%以上注釋的circRNA可以在頭部檢測到,而這些轉(zhuǎn)錄本的一半在任何其他組織中都沒有檢測到。由于circRNA在神經(jīng)發(fā)生過程中經(jīng)常上調(diào),并可在突觸中富集,因此有人認為它們可能對神經(jīng)元功能有反應(yīng)和/或調(diào)節(jié)作用。
circRNA的高通量鑒定
用去核糖體RNAs (rRNAs)和使用隨機引物的RNA-seq,已成為目前鑒定circRNA的主流方法。此外,在許多方案中,會進一步采用核酸外切酶如RNase R或poly(A)富集步驟來去掉線性mRNAs。另外,目前也已出現(xiàn)了包含有反向剪接探針的芯片。在計算方面,已經(jīng)開發(fā)了多條可以從RNA-seq數(shù)據(jù)集中識別circRNA的管線,包括find_circ、CIRI、KNIFE、NCLScan、Segemehl、DCC、UROBORUS和PTESFinder等。盡管所有這些算法都支持circRNA的識別,但是它們預(yù)測的circRNA集合確實也存在顯著差異的情況。有研究曾將相同的RNA-seq數(shù)據(jù)集被獨立地輸入到五個算法中時,許多(~40%)假定的circRNA僅由單個算法預(yù)測出。預(yù)測的circRNA總數(shù)從1532個到4067個不等,所有五種算法僅鑒定出854個共有circRNA。因此,各種算法在靈敏度和精度上存在較明顯差異,目前該領(lǐng)域缺乏從RNA-seq數(shù)據(jù)集識別circRNA的金標(biāo)準方法。因此,本文建議使用多個獨立的管線來鑒定circRNA候選物,并隨后使用獨立的方法對候選物進行驗證,包括包含有反向剪接點的RT-PCR和Northern blotting。隨著RNA-seq分析算法的進一步改進,計算消除噪音和僅識別真正的circRNA也會變得更加容易。
內(nèi)含子重復(fù)之間的堿基配對有利于circRNA的產(chǎn)生
所有內(nèi)部外顯子(不包括基因的第一個和最后一個外顯子)在其3’端和5’端都有剪接信號,理論上都可以被環(huán)化。然而,在細胞中只觀察到一小部分的反向剪接事件發(fā)生,部分原因是這些反應(yīng)經(jīng)常以極低的效率發(fā)生。當(dāng)真的發(fā)生反向剪接時,它可以產(chǎn)生包含單個外顯子的圓形RNA,該外顯子通常比平均表達的外顯子長,或者包含多個外顯子的circRNA。最常見的circRNA有2-3個外顯子,內(nèi)部內(nèi)含子被去除。因為環(huán)狀外顯子旁的內(nèi)含子通常比平均值長。2013年的一篇研究發(fā)現(xiàn),在人類circRNA周圍尋找到豐富的內(nèi)含子重復(fù)基序,通常觀察到成對的Alu重復(fù)元件( ~ 300-nt長)。這種排列類似于小鼠Sry circRNA旁側(cè)序列中的互補內(nèi)含子重復(fù)序列,暗示了內(nèi)含子重復(fù)可能是反向剪接的共同驅(qū)動因素。事實上,在人類、小鼠、豬、秀麗隱桿線蟲和果蠅中,許多高表達的circRNA兩側(cè)都常有互補的重復(fù)序列,并且可以通過簡單地在側(cè)翼內(nèi)含子中搜索互補序列來準確預(yù)測許多circRNA。除了Alu重復(fù)元件(靈長類特有的)之外,各種互補序列可以側(cè)翼于circRNA,包括非重復(fù)序列。因此,目前認為大多數(shù)反向剪接事件不需要特定的序列基序(在剪接位點之外),而是通過側(cè)翼內(nèi)含子元件之間的堿基配對相互作用來促進。
通過使用表達質(zhì)?;蛲ㄟ^使用CRISPR-Cas9從內(nèi)源基因座中去除內(nèi)含子重復(fù),人們已經(jīng)證明了內(nèi)含子重復(fù)之間的堿基配對確實可以促進circRNA的生物發(fā)生。但由于基因組重復(fù)在物種之間存在顯著差異,因此不同的真核生物可以表達不同的circRNA。即使蛋白質(zhì)編碼外顯子在進化上是保守的,基因的最終輸出和功能可能在生物體之間也會有所不同。
在一些基因座中,短內(nèi)含子重復(fù)(~30-nt,包括簡單重復(fù))之間的堿基配對能夠促進circRNA的產(chǎn)生。盡管如此,內(nèi)含子重復(fù)的存在并不總是足以引發(fā)反向剪接,因此,circRNA可以以組織特異性的方式表達。這是由于剪接、熱力學(xué)、RNA結(jié)合蛋白調(diào)節(jié)共同轉(zhuǎn)錄的特性,以及大多數(shù)內(nèi)含子含有競爭堿基配對的多個重復(fù)元件決定的。根據(jù)重復(fù)元件之間的堿基配對方式,可以產(chǎn)生非常不同的剪接異構(gòu)體(圖2)。當(dāng)堿基配對發(fā)生在不同的內(nèi)含子上時,會誘導(dǎo)反向剪接,產(chǎn)生由插入的外顯子組成的circRNA。相反,當(dāng)堿基配對在單個內(nèi)含子內(nèi)局部發(fā)生時,發(fā)生標(biāo)準剪接以產(chǎn)生線性mRNA。重復(fù)元件的數(shù)量、它們之間的距離以及它們的互補程度都影響序列堿基配對,從而影響剪接結(jié)果。這種競爭還允許單個蛋白質(zhì)編碼基因產(chǎn)生多個不同的circRNA,這一過程稱為可變環(huán)化
圖2、內(nèi)含子重復(fù)序列之間的堿基配對有助于反向剪接事件發(fā)生。
(a) 黑腹果蠅laccase2基因的外顯子/內(nèi)含子結(jié)構(gòu),突出顯示可產(chǎn)生490-nt circRNA的外顯子2。一對DNAREP1_DM轉(zhuǎn)座子(紅色箭頭)插入側(cè)翼外顯子2。這些內(nèi)含子序列之間的堿基配對,有利于反向剪接發(fā)生。 (b) 當(dāng)mRNA前體中存在多個內(nèi)含子重復(fù)元件(紅色箭頭)時,根據(jù)彼此的重復(fù)堿基對(用灰色弧線表示),可以產(chǎn)生不同的成熟RNA。a-c為不同內(nèi)含子中重復(fù)序列之間的堿基配對導(dǎo)致反向剪接并產(chǎn)生包含單個外顯子(a和c)或多個外顯子(b)的circRNA。d相反,當(dāng)在單個內(nèi)含子堿基對中彼此重復(fù)時,產(chǎn)生線性mRNA
外顯子跳躍常常與circRNA的生成有關(guān)
最近的全轉(zhuǎn)錄組分析表明,一些circRNA的生物發(fā)生可以與外顯子跳躍(或稱外顯子跳讀)事件偶聯(lián),進而允許從單個mRNA前體產(chǎn)生線性mRNA和circRNA (圖3)。在某些情況下,外顯子跳躍的mRNA變體以非常低的水平表達,并且僅可通過RT-PCR檢測,而不是通過RNA-seq檢測。Barrett等人在2015年對mrps16基因的研究中完美地展示了外顯子跳躍和circRNA產(chǎn)生之間的強耦合現(xiàn)象。將mrps16基因的外顯子1與外顯子3剪接導(dǎo)入含有外顯子2的內(nèi)含子套索中,隨后會再次剪接以將外顯子2的起點和終點連接在一起。由此,這一重新發(fā)生的事件產(chǎn)生了成熟的circRNA,潛在的細節(jié)雖然尚未完全知曉,但將外顯子跳躍與circRNA產(chǎn)生耦合的實驗,提供了在沒有內(nèi)含子重復(fù)的情況下產(chǎn)生circRNA的另一種發(fā)生機制。
圖3、外顯子跳躍可直接與circRNA產(chǎn)生偶聯(lián)。在mrps16基因上,外顯子跳躍導(dǎo)致成熟的線性mRNA以及含有外顯子2的內(nèi)含子套索的產(chǎn)生。這種套索被重新拼接以產(chǎn)生成熟的circRNA
通過RNA結(jié)合蛋白調(diào)控circRNA水平
除了順式作用的內(nèi)含子重復(fù)和外顯子跳躍事件之外,RNA結(jié)合蛋白也是circRNA的關(guān)鍵調(diào)節(jié)子,它們允許這些轉(zhuǎn)錄本以組織特異性模式表達或者隨著細胞改變而被誘導(dǎo)/抑制。例如,內(nèi)含子重復(fù)本身可以直接與反式作用因子結(jié)合,包括NF90/NF110或者結(jié)合雙鏈RNA的RNA解旋酶DHX9。DHX9結(jié)合可抑制反向剪接反應(yīng),可能是通過直接解鏈雙鏈內(nèi)含子區(qū),或通過募集ADAR (作用于RNA的腺苷脫氨酶)酶將腺苷轉(zhuǎn)化為肌苷。由于DHX9在分化過程中上調(diào),有人提出,這些DHX9驅(qū)動的機制可使細胞主動抑制多種circRNA的產(chǎn)生。另一方面,選擇性剪接因子QKI促進了人類上皮-間充質(zhì)轉(zhuǎn)化(EMT)過程中數(shù)百個circRNA的產(chǎn)生。這似乎是因為QKI與側(cè)翼內(nèi)含子結(jié)合并形成二聚體,從而使插入的剪接位點非常接近(類似于反向重復(fù)如何促進反向剪接)。果蠅(Mbl)蛋白同樣可以結(jié)合自身mRNA前體中的內(nèi)含子元件,以促進circRNA的產(chǎn)生,從而自動調(diào)節(jié)宿主基因表達,并確保Mbl蛋白水平保持在一個嚴格的范圍內(nèi)。
circRNA的生成可以可以進一步被FUS以及由多個hnRNP和SR蛋白質(zhì)調(diào)控。如上所述,果蠅laccase2 circRNA的產(chǎn)生通過內(nèi)含子重復(fù)元件之間的堿基配對來促進,但其表達也受到多個hnRNPs和SR蛋白的抑制。有趣的是,這些剪接因子的同時缺失導(dǎo)致laccase2 circRNA水平的增加,這表明每個因子在影響剪接決定方面起著非冗余作用。因此,circRNA以組合方式受到控制,內(nèi)含子重復(fù)通常提供了發(fā)生反向剪接的機會,以及各種微效的調(diào)控??紤]到每個外顯子或內(nèi)含子都有自己獨特的一組蛋白結(jié)合位點,人們可以很容易地想象這種編碼如何被用來產(chǎn)生各種不同的circRNA表達模式。
當(dāng)剪接機制受限時基因輸出方式轉(zhuǎn)向circRNA
盡管突變剪接位點可以導(dǎo)致circRNA無法生成,在果蠅上的研究發(fā)現(xiàn),當(dāng)細胞中的核心剪接體或轉(zhuǎn)錄終止因子不足時,circRNA可以成為首選的基因輸出形式。核心剪接體成分的缺失導(dǎo)致接合的線性mRNA表達降低。與此形成鮮明對比的是,我們發(fā)現(xiàn),當(dāng)細胞中功能截然不同的因子從剪接體中耗盡時,許多單外顯子環(huán)狀RNA,包括laccase2 circRNA的表達增加。
在剪接體組裝的早期過程,特別是在外顯子初始鑒定的機制中,較好的詮釋了經(jīng)典剪接和反向剪接之間敏感性的差異(圖4)。在外顯子定義期間( Berget,1995 ),U1和U2 snRNPs結(jié)合在每個外顯子的相對端,并由蛋白質(zhì)-蛋白質(zhì)相互作用來加以穩(wěn)定,該作用網(wǎng)絡(luò)包括附加因子,例如SR蛋白質(zhì)。然后,這些外顯子相互作用必須轉(zhuǎn)化為交叉內(nèi)含子相互作用(將剪接位點與獨立內(nèi)含子配對),以產(chǎn)生經(jīng)典剪接的線性mRNA。然而,為了產(chǎn)生circRNA,這些初始外顯子復(fù)合物可能不會被破壞,而是可以直接轉(zhuǎn)化為有催化能力的反向剪接復(fù)合物。當(dāng)核心剪接體從細胞中耗盡時,交叉外顯子相互作用不容易被交叉內(nèi)含子相互作用取代,從而使單個外顯子circRNA成為首選的剪接結(jié)果。目前還不清楚反向剪接是否使用與標(biāo)準剪接反應(yīng)完全相同的核心剪接體成分,但這項工作為思考如何獲得circRNA水平的整體變化(至少是由單個外顯子產(chǎn)生的變化)提供了參考。如果一個組織具有有限數(shù)量的剪接體成分,預(yù)計將產(chǎn)生更高水平的circRNA,特別是高度轉(zhuǎn)錄的基因。因此,確定這一模型在產(chǎn)生最高數(shù)量circRNA的神經(jīng)元或衰老組織中是否成立將是非常有意義。
圖4、剪接體組件決定標(biāo)準拼接或反向剪接發(fā)生模型。在具有長內(nèi)含子的mRNAs前體中,剪接體組件首先在每個外顯子上組裝。U1 snRNP (紅色)和U2 snRNP (綠色)分別識別5’端和3’端的剪接位點,另外一些因子,如SR蛋白,用于穩(wěn)定外顯子復(fù)合體。這些跨外顯子的相互作用必須被跨內(nèi)含子的相互作用取代,以便產(chǎn)生成熟的線性mRNA (左)。然而,當(dāng)剪接體的活性受到限制時(例如由于核心剪接體組件的耗盡),跨外顯子的相互作用可能不容易被破壞,而完全剪接體聚集在外顯子上,導(dǎo)致反向剪接的產(chǎn)生(右)
circRNA可以調(diào)控microRNA的活性和水平
一旦circRNA生成后便可以自然抵抗外切核酸酶降解,并作為穩(wěn)定轉(zhuǎn)錄本積累(例如,統(tǒng)計了60個人類circRNA半衰期中位數(shù)為約24小時)。那么circRNA的分子功能是什么呢?超過99.9%的已鑒定circRNA,功能仍然未知。在已知功能circRNA中,一些用于調(diào)控microRNA。microRNA是一種約21-nt的小RNA,通過與mRNA堿基配對和抑制蛋白質(zhì)產(chǎn)生和/或引發(fā)mRNA降解而在轉(zhuǎn)錄后發(fā)揮作用(圖5a)。通過在circRNA中尋找保守的microRNA靶向位點,例如小鼠Sry circRNA含有16個miR-138結(jié)合位點,而CDR1as則含有70多個miR-7進化保守的結(jié)合位點。因此,這些circRNA可以用作誘餌或海綿,降低了游離miR-138或miR-7轉(zhuǎn)錄本的數(shù)量。CDR1as衍生自反義長非編碼RNA,CRD1as中存在約70個miR-7結(jié)合位點,沒有一個與miR-7完全互補,miR-7允許circRNA緊密結(jié)合但不被miR-7切割。與這一觀點一致,耗盡細胞中的CDR1as將導(dǎo)致miR-7靶mRNAs下調(diào),可能是因為miR-7不再被隔離導(dǎo)致。CDR1as還含有與miR-671幾乎完全互補的區(qū)域,這使得circRNA能夠以依賴于miR-671的方式被Argonaute2 (AGO2 )核內(nèi)切割。這就產(chǎn)生了一種模型,其中CDR1as有助于儲存和/或運輸miR-7 (與Argonaute蛋白結(jié)合),直到miR-671切割circRNA,釋放miR-7,從而可以調(diào)節(jié)mRNA在特定亞細胞位置的表達(圖5a)。
圖5、circRNA可以具有多種分子功能。
(a)一些circRNA,包括CDR1as和Sry,能夠結(jié)合許多拷貝的特定microRNA,響應(yīng)于特定刺激,circRNA可能釋放這些microRNA轉(zhuǎn)錄本,然后這些轉(zhuǎn)錄本結(jié)合到mRNA可以下調(diào)它們的表達。 (b)最近研究表明,來自同一基因座的線性mRNAs和circRNA可以被翻譯成不同的蛋白質(zhì)產(chǎn)物。在所示的實施例中,成熟的線性mRNA (頂部)和circRNA (底部)使用相同的AUG起始密碼子(綠色),但是circRNA產(chǎn)生截短的蛋白質(zhì),該蛋白質(zhì)終止于反向剪接連接后遇到的終止密碼子。 (c)擬南芥SEP3 circRNA的一些拷貝保留在細胞核中,在內(nèi)源SEP3基因座形成R環(huán)( RNA:DNA雜交體),影響宿主基因的可變剪接
在小鼠中,CDR1as circRNA在興奮性神經(jīng)元中高度表達,在抑制性神經(jīng)元、膠質(zhì)細胞或非神經(jīng)元組織中表達最少。在除去CDR1as基因區(qū)域后,敲除小鼠是存活的、可育的,并且在成人腦解剖結(jié)構(gòu)中沒有顯示嚴重異常。但也觀察到興奮性突觸傳遞的缺陷,敲除小鼠表現(xiàn)出感覺運動控制受損,這是一種與神經(jīng)精神障礙相關(guān)的行為表型。這些效應(yīng)可能是由于CDR1as circRNA的缺失導(dǎo)致。
因此,CDR1as基因座很好地展示了circRNA和microRNA如何具有重要生物學(xué)效應(yīng)的動態(tài)相互作用,但對于其他circRNA是否以類似方式發(fā)揮作用仍有待進一步研究。這是因為多數(shù)帶注釋的circRNA含有較少的microRNA結(jié)合位點。然而,有新的證據(jù)表明,包括人類和果蠅中的許多circRNA可能起到海綿吸附特異性microRNA的作用。例如,當(dāng)人表皮干細胞分化時誘導(dǎo)的circZNF91含有24個miR23b-3p結(jié)合位點,這是已知的調(diào)節(jié)角質(zhì)細胞分化的microRNA。由于在分化過程中上調(diào)的其他circRNA也具有數(shù)量顯著的microRNA結(jié)合位點,有人預(yù)測,當(dāng)細胞改變狀態(tài)時,一部分circRNA可能會吸附關(guān)鍵的microRNA,因此確定circRNA有助于緩沖調(diào)節(jié)網(wǎng)絡(luò)免受干擾將是有趣的研究。
circRNA的翻譯
最初的實驗表明,由于缺乏5’端帽子結(jié)構(gòu),真核核糖體不能裝載到circRNA上,因此認為無法翻譯。但后來證明,內(nèi)部核糖體進入位點(IRES)的存在使得合成的circRNA能夠在體外和細胞中翻譯。IRES元件存在于多種病毒中,直接結(jié)合翻譯起始因子或核糖體本身,從而允許翻譯以獨立于帽子的方式發(fā)生。因為最初的報道沒有發(fā)現(xiàn)與核糖體共沉淀的circRNA或核糖體圖譜庫,看來內(nèi)源性circRNA可能無法募集核糖體。然而,最近有報道指出,內(nèi)源性circRNA的一個子集實際上可能被翻譯。
人circ-ZNF609包含753-nt開放閱讀框,與線性mRNA有相同的AUG密碼子和終止密碼子,該終止密碼子在反向剪接連接處遇到三個核苷酸(圖5b)。這種circRNA與多聚體和表達質(zhì)粒共同沉積的一小部分但很重要的部分顯示,circ-ZNF609可以被弱翻譯(效率比線性mRNA低兩個數(shù)量級)。有趣的是,circ-ZNF609的敲除導(dǎo)致人和小鼠成肌細胞的增殖缺陷,但來源于circ-ZNF609的蛋白質(zhì)是否有助于這種表型的產(chǎn)生仍不得而知。
利用質(zhì)譜技術(shù),鑒定出另外19個人類包含內(nèi)源性circRNA反向剪接點的的多肽。深度測序數(shù)據(jù)集也揭示了122個與核糖體相關(guān)的果蠅circRNA。對于40%的這些果蠅circRNA,翻譯預(yù)計使用與宿主線性mRNA相同的起始密碼子,并在反向剪接連接點后終止。許多預(yù)測的ORFs至少有一個可識別的蛋白質(zhì)結(jié)構(gòu)域,但必須指出,目前只有一個測序read支持絕大多數(shù)這些翻譯事件。幾乎不可能用核糖體圖譜來尋找圓形RNA上的核糖體定相或起始/終止密碼子,因此使用mini基因表達質(zhì)粒、蔗糖梯度離心、突變分析和質(zhì)譜的組合來進一步驗證這些circRNA中的一些確實可以翻譯的假設(shè)。值得注意的是,該研究表明circRNA翻譯可能經(jīng)常發(fā)生在膜相關(guān)核糖體上或富含膜(例如突觸)的亞細胞結(jié)構(gòu)中。
與預(yù)期一致,當(dāng)插入雙順反子報告子構(gòu)建體時,circRNA起始密碼子上游的區(qū)域具有可檢測到的IRES活性。對于circZNF609,IRES活性需要剪接,這表明外顯子連接復(fù)合體的沉積可能會增強一些circRNA的翻譯。進一步研究證明,N6-基腺苷( m6A )殘基在circRNA中富集 (約13 %的circRNA含有m6A ),這些修飾的核苷酸可以促進翻譯。事實上,單個m6A位點可能足以啟動合成circRNA的翻譯。結(jié)合m6A后,YTHDF3 reader蛋白質(zhì)將翻譯起始因子,包括eIF4G2和eIF3A被招募到circRNA上。
由于基于全基因組的研究未能獲得circRNA能夠翻譯的任何證據(jù),這些最近描述的翻譯事件中有許多可能代表技術(shù)或生物噪聲?,F(xiàn)在需要進一步的工作來確定有多少circRNA被真正翻譯達到顯著水平。人們很容易推測,在circRNA的長壽命期間可以產(chǎn)生大量蛋白質(zhì),并且這些內(nèi)源性蛋白質(zhì)可以充當(dāng)顯性陰性和/或調(diào)節(jié)與其相關(guān)的宿主線性mRNA產(chǎn)生的蛋白質(zhì)相同的功能。除了自身翻譯之外,有越來越多的證據(jù)表明,一些circRNA,包括circPABPN1,可以調(diào)節(jié)它們相關(guān)的線性mRNA的翻譯。還發(fā)現(xiàn)成熟的circRNA與多種其他蛋白質(zhì)結(jié)合,這表明這些轉(zhuǎn)錄本可能影響多種其他蛋白質(zhì)活性或功能。
細胞核內(nèi)的circRNA調(diào)節(jié)宿主基因的轉(zhuǎn)錄和選擇性剪接
大多數(shù)表征的circRNA主要位于細胞質(zhì)中,但現(xiàn)在出現(xiàn)了在細胞核中起作用的circRNA的例子。外顯子-內(nèi)含子circRNA不完全剪接,具有保留的內(nèi)含子,允許它們與U1 snRNP相互作用并促進宿主基因的轉(zhuǎn)錄。在擬南芥中,一個關(guān)鍵的發(fā)育調(diào)控基因SEPALLATA3 ( SEP3 )的外顯子6產(chǎn)生一個circRNA,這些環(huán)狀轉(zhuǎn)錄物中約15%保留在細胞核中(圖5c)。值得注意的是,過度表達SEP3 circRNA (但不是外顯子6的線性轉(zhuǎn)錄本)的植物產(chǎn)生的花比正常植物雄蕊少,花瓣多。這似乎是因為外切表達的circRNA在內(nèi)源SEP3基因組基因座形成R環(huán)(RNA:DNA雜交),這導(dǎo)致跳過外顯子6的線性SEP3剪接變體的產(chǎn)量增加(圖5c)。由于該SEP3剪接變體的過度表達足以引起與SEP3 circRNA的過度表達相同的同源異型表型,因此該circRNA似乎僅通過調(diào)節(jié)其宿主基因的可變剪接發(fā)揮作用。circRNA究竟是如何做到這一點尚待確定,但有人提出,R環(huán)導(dǎo)致SEP3轉(zhuǎn)錄暫停,從而可以招募促進外顯子跳躍的可變剪接調(diào)節(jié)因子。值得注意的是,擬南芥中約5%的Rloops對RNase R處理具有抗性,表明其他circRNA也可以結(jié)合基因組DNA來調(diào)節(jié)轉(zhuǎn)錄或可變剪接模式。
免疫系統(tǒng)與環(huán)狀RNA的相互作用
考慮到某些circRNA,包括類病毒和HDV是病原體,人們會期望真核生物免疫系統(tǒng)能夠以某種方式感知和消滅這些外來入侵者。事實上,當(dāng)HeLa細胞被使用自剪接體I內(nèi)含子體外制備的circRNA轉(zhuǎn)染或剪接連接時,大量眾所周知的識別受體,包括RIG-I和MD5,以及其他先天免疫調(diào)節(jié)子和細胞因子被強烈誘導(dǎo)。因此,細胞能夠?qū)ν庠碿ircRNA產(chǎn)生顯著的免疫應(yīng)答,這種應(yīng)答實際上比將編碼相同序列的線性RNA轉(zhuǎn)染到細胞中時更強。人們對circRNA的感知還不完全清楚,但一些重要的方面已經(jīng)被揭示出來。首先,RIG-I是免疫應(yīng)答所必需的,并與外源circRNA共定位。其次,circRNA轉(zhuǎn)錄本是自我還是非自我的形成機制被認為是關(guān)鍵決定因素。每當(dāng)使用自剪接I組內(nèi)含子制備circRNA時(即使是在來自表達質(zhì)粒的細胞中制備),觀察到強有力的免疫應(yīng)答。與此形成鮮明對比的是,使用剪接體制備的circRNA總是被認為是自我的(不管成熟circRNA或其側(cè)翼內(nèi)含子的序列如何)。這大概是因為剪接體在circRNA上沉積了許多RNA結(jié)合蛋白,例如外顯子連接復(fù)合體或核輸出機制,這些RNA以某種方式將circRNA標(biāo)記為自身。以這種方式,細胞能夠感應(yīng)和應(yīng)答多種外源circRNA,而不管它們的主要序列如何,同時對許多內(nèi)源circRNA不產(chǎn)生應(yīng)答?,F(xiàn)在還需要進一步的工作來理解RIG-I如何準確識別外來circRNA,以及剪接體反向剪接如何防止自身免疫反應(yīng)。
除了確保識別外源circRNA之外,多種免疫調(diào)節(jié)子,包括RIG-I和dsRNA結(jié)合蛋白NF90/NF110,似乎也調(diào)節(jié)內(nèi)源性環(huán)狀RNA的表達。在正常生長的細胞中,NF90/NF110與位于許多(~30%)外顯子旁的內(nèi)含子中富含A/U的元件(包括堿基配對的Alu元件)結(jié)合,這些外顯子產(chǎn)生circRNA并起到促進反向剪接事件的作用。然而,在病毒感染時,NF90/NF110穿梭于細胞質(zhì)以結(jié)合病毒轉(zhuǎn)錄本并抑制病毒復(fù)制,這導(dǎo)致NF90/NF110結(jié)合細胞核中較少的新生mRNA前體,從而導(dǎo)致circRNA的產(chǎn)生減少。有趣的是,NF90/NF110還能夠結(jié)合細胞質(zhì)中一些成熟的circRNA,并且實際上比線性RNA對circRNA表現(xiàn)出更高的親和力。因此,正常生成的circRNA允許在細胞質(zhì)中建立NF90/NF110的分子庫,當(dāng)需要時,可以釋放該分子庫,以便能夠?qū)Σ《靖腥咀鞒鲅杆俜磻?yīng)。
circRNA在衰老和疾病中的作用
可變剪接模式已經(jīng)顯示隨著老化而改變。隨著果蠅、秀麗線蟲和小鼠衰老,神經(jīng)系統(tǒng)中circRNA表達有增加的趨勢。例如,在2513個檢測到的果蠅circRNA中,262個在20日齡頭部中與1日齡相比顯著上調(diào)。值得注意的是,這些表達的增加在很大程度上與宿主基因中線性mRNAs表達的變化無關(guān),并且在衰老小鼠心臟或恒河猴肌肉中沒有觀察到,這表明circRNA可能在老化的神經(jīng)系統(tǒng)中首先穩(wěn)定生成,但目前尚不清楚這種circRNA的積累是保護性的、有害的還是無害的。至少在小鼠身上,從Pwwp2a基因衍生的circRNA似乎有助于防止病理性肥大和心力衰竭。
與正常組織相比,癌細胞z中的circRNA通常下調(diào)表達,這可能部分由于細胞分裂稀釋造成。與這一觀點一致,最近發(fā)現(xiàn),隨著細胞分化和增殖停止,circRNA水平經(jīng)常增加。下調(diào)一些circRNA,可以促進細胞生長,過表達則促進增殖。特別值得注意的是,當(dāng)斷點堿基對兩側(cè)的內(nèi)含子序列彼此相鄰時,癌癥相關(guān)染色體易位可導(dǎo)致異常融合circRNA的產(chǎn)生,這些融合circRNA可促進轉(zhuǎn)化、細胞活力和抗性治療,因此代表了新的治療靶點。此外,因為一些circRNA存在于外體/胞外囊泡和體液中,circRNA可能代表有希望的癌癥生物標(biāo)志物。將circRNA包裝成囊泡可能是從細胞中消除circRNA的一種方式和/或?qū)崿F(xiàn)細胞間通信的機制。
circRNA研究展望
RNA-seq現(xiàn)已鑒定出數(shù)千個circRNA,但仍需記住,絕大多數(shù)RNA從未通過正向技術(shù)驗證或詳細研究過。因此,要從這些列表中消除測序假象,區(qū)分反向剪接事件事件,以及完全表征circRNA表達模式,還有許多工作要做。然而,越來越多的circRNA現(xiàn)在已經(jīng)被足夠詳細地研究,因此我們對它們?nèi)绾萎a(chǎn)生、調(diào)節(jié)和功能有了重要的認識。特別是對生物發(fā)生機制的深入了解已經(jīng)轉(zhuǎn)化為在細胞中表達circRNA的有效方法,并使一些circRNA的功能得以揭示。通過將過表達研究與CRISPR-Cas9產(chǎn)生的circRNA敲除結(jié)合起來,未來幾年可能會確定更多circRNA的功能。應(yīng)該可以使用CRISPR-Cas9去除側(cè)翼內(nèi)含子重復(fù)元件,從而剔除感興趣的circRNA,同時不影響宿主基因的線性RNA產(chǎn)生。
內(nèi)含子重復(fù)對于許多circRNA的生物發(fā)生至關(guān)重要(圖2),但對于基因如何在沒有重復(fù)的情況下產(chǎn)生circRNA仍不完全了解。例如,在人表皮干細胞分化過程中,大部分circRNA上調(diào)或果蠅沒有側(cè)翼重復(fù),并且不清楚這些外顯子是如何被選擇用于反向剪接的。除了外顯子跳躍事件(圖3),可能還有許多順式和反式調(diào)節(jié)機制有待發(fā)現(xiàn),這些機制能夠?qū)崿F(xiàn)特定的circRNA表達模式。此外,還需要進一步研究,以了解反向剪接反應(yīng)的詳細機制,并確定是否涉及所有規(guī)范的核心剪接體組件。
一旦產(chǎn)生了circRNA,人們對它們是如何在細胞質(zhì)中積累,特別是在非分裂細胞中積累的知之甚少。其他種類RNA的特定結(jié)構(gòu)特征被受體蛋白識別,使得這些轉(zhuǎn)錄本能夠被帶到核孔復(fù)合體中以輸出到細胞質(zhì)中。circRNA可能存在類似的機制,更好地理解與circRNA相互作用的蛋白質(zhì),特別是在它們的生物發(fā)生過程中,可能有助于揭示circRNA定位是如何被控制并在發(fā)育過程中如何改變的。對于那些與核糖體相關(guān)的circRNA (圖5b),核糖體在轉(zhuǎn)錄物上的組裝到底是怎樣的,所產(chǎn)生的蛋白質(zhì)積累到足夠高的水平以具有生物學(xué)效應(yīng)?大量未翻譯的circRNA可能有助于形成大型RNA-蛋白質(zhì)復(fù)合物,或者以其他方式影響與其親本基因產(chǎn)生的蛋白質(zhì)相同的途徑?;蛘撸琧ircRNA的產(chǎn)生本身可能是關(guān)鍵的功能事件,因為反向剪接反應(yīng)可用于降低線性mRNA的表達或終止讀通轉(zhuǎn)錄事件。
內(nèi)源性circRNA是如何被識別為自身的,是否有可能在體外產(chǎn)生不引起免疫反應(yīng)的環(huán)狀RNA?這一途徑可以開辟許多生物技術(shù)應(yīng)用,在這些應(yīng)用中,用持久的circRNA用于治療細胞或病人可能是理想的。許多circRNA具有較長的半衰期,但circRNA最終降解的機制仍不清楚。CDR1as circRNA可以被AGO2切割,但這似乎是一個孤立的機制。其他RNA內(nèi)切核酸酶通??梢酝ㄟ^提供外切核酸酶的接入點來促進circRNA的衰變,并且快速降解的circRNA的鑒定可以提供定義這種機制的起點。綜上所述,近幾年在circRNA研究中許多令人驚訝的發(fā)現(xiàn)已經(jīng)被揭露出來,這個領(lǐng)域已經(jīng)準備好揭露更多關(guān)于這些轉(zhuǎn)錄本是如何被調(diào)節(jié)和作用,以影響正常和疾病狀態(tài)的見解。 |
|