第一單元 lncRNA數(shù)據(jù)庫 長鏈非編碼RNA(Long non-coding RNA, lncRNA)是長度大于 200 個核苷酸的非編碼RNA。研究表明, lncRNA 在劑量補(bǔ)償效應(yīng)、表觀遺傳調(diào)控、細(xì)胞周期調(diào)控和細(xì)胞分化調(diào)控等眾多生命活動中發(fā)揮重要作用,成為遺傳學(xué)研究熱點(diǎn)。以下是針對長鏈非編碼lncRNA的數(shù)據(jù)庫: LncRNA Disease datebase http://www./lncrnadisease LncRNADisease數(shù)據(jù)庫整理了實(shí)驗(yàn)支持的lncRNA-疾病關(guān)聯(lián)數(shù)據(jù)的資源,還整合了用于預(yù)測新型lncRNA-疾病關(guān)聯(lián)的工具該數(shù)據(jù),旨在提供人類lncRNA的全面功能注釋。此外,LncRNADisease還可以在各種水平上促進(jìn)lncRNA相互作用,包括蛋白質(zhì),RNA,miRNA和DNA,目前提供1564個人類lncRNAs對疾病的預(yù)測結(jié)果。 IncRNASNP http ://bioinfo.life.hust.edu.cn/lncRNASNP IncRNASNP 是提供人、小鼠長鏈非編碼RNA(lncRNA)中單核苷酸多態(tài)性(SNP)的全面資源的數(shù)據(jù)庫。它包含lncRNA中的SNP位點(diǎn),探究SNP對lncRNA結(jié)構(gòu)的影響,lncRNA中的突變以及l(fā)ncRNA:miRNA結(jié)合,分析SNP位點(diǎn)對于lncRNA與miRNA結(jié)合的影響。lncRNASNP2數(shù)據(jù)庫中人類lncRNA和SNP的數(shù)量已更新為141,353和10,205,295。 http : //www.bio-bigdata.net/lnc2cancer/ Lnc2Cancer是一個手動管理的數(shù)據(jù)庫,作者在PUBMED搜集了超過6500篇文獻(xiàn)中LncRNA與癌癥之間的關(guān)聯(lián),完善了lncRNA-癌癥關(guān)聯(lián)并進(jìn)行了注釋,可提供lncRNA或circRNA與人類癌癥之間全面的實(shí)驗(yàn)支持關(guān)聯(lián)進(jìn)行評分以及能夠?yàn)g覽癌癥中LncRNA譜的高通量實(shí)驗(yàn)。 http://www./rnalocate RNALocate是提供一個RNA亞細(xì)胞定位的高效的處理、瀏覽和分析的資源庫。當(dāng)前版本的RNALocate記錄了超過190,000個與RNA相關(guān)的亞細(xì)胞定位條目,并提供了實(shí)驗(yàn)和預(yù)測證據(jù),涉及65種物種中超過105,000個具有44個亞細(xì)胞定位的RNA,主要包括智人,小家鼠和釀酒酵母等,有超過21800條RNA(9種RNA類型,包括mRNA, miRNA, lncRNA等等)和42種亞細(xì)胞定位(主要包括細(xì)胞核、細(xì)胞質(zhì)、內(nèi)質(zhì)網(wǎng)和核糖體等)。 LNCipedia https:/// LNCipedia是一個公共數(shù)據(jù)庫,用于存儲較長的非編碼RNA(lncRNA)序列和注釋。該數(shù)據(jù)庫整合了多個人類(Human)lncRNA數(shù)據(jù)庫信息,很大程度上解決了lncRNA數(shù)據(jù)庫各自為政的問題。整合的數(shù)據(jù)庫包括LncRNAdb、Broad Institute、Ensembl、Gencode、Refseq等,并賦予了它們統(tǒng)一ID,同時還包含ncRNA轉(zhuǎn)錄本在基因組位置、長度、結(jié)構(gòu)、miRNA結(jié)合、lncRNA在其他數(shù)據(jù)庫中相關(guān)記錄等信息。使用者可以在該數(shù)據(jù)庫中錄入、搜索和下載lncRNA相關(guān)信息現(xiàn)在已經(jīng)升級到5.3版本。 AnnoLnc http://annolnc./ AnnoLnc是一個系統(tǒng)地注釋新的人類lncRNA的一站式網(wǎng)站。目前是該工具基于700多個數(shù)據(jù)資源和各種工具鏈,AnnoLnc的系統(tǒng)性注釋涵蓋了基因組位置,二級結(jié)構(gòu),表達(dá)模式,轉(zhuǎn)錄調(diào)控,miRNA相互作用,蛋白質(zhì)相互作用,遺傳關(guān)聯(lián)和進(jìn)化。 第二單元 MicroRNA數(shù)據(jù)庫 MicroRNA(miRNA )是一類內(nèi)生的、長度約為20-24個核苷酸的小 RNA,其在細(xì)胞內(nèi)具有多種重要的調(diào)節(jié)作用。每個 miRNA 可以有多個靶基因的表達(dá),而幾個 miRNA 也可以調(diào)節(jié)同一個基因的表達(dá)。據(jù)推測,miRNA 調(diào)節(jié)著人類三分之一的基因。以下是針對miRNA的數(shù)據(jù)庫: YM500v2 http://ngs./ym500v2/index.php YM500v2是用于個人smRNA-seq數(shù)據(jù)集的miRNA定量,是鑒定miRNA 和新型miRNA預(yù)測的集成數(shù)據(jù)庫。YM500v2中包含了YM500之后開發(fā)的與miRNA相關(guān)的新算法,納入了8000多個與癌癥相關(guān)的smRNA-seq數(shù)據(jù)集,可用于microRNA研究,是miRNA的表達(dá)譜數(shù)據(jù)以及相關(guān)分析。YM500v2可用于靶基因預(yù)測、組間差異表達(dá)等分析進(jìn)行處理。 Starbase http://starbase./ Starbase結(jié)合源自10882個RNA-seq和10546個miRNA-seq數(shù)據(jù)的32種癌癥的基因表達(dá)數(shù)據(jù),ENCORI允許研究人員對RNA-RNA和RBP-RNA相互作用進(jìn)行泛癌分析,還提供平臺進(jìn)行miRNA,lncRNA,假基因和mRNA的存活和差異表達(dá)分析。不僅可以分別顯示多個miRNA靶基因預(yù)測結(jié)果,還囊括了多種miRNA的功能信息和其在腫瘤中表達(dá)情況。 miRWalk http://mirwalk.umm./ miRWalk是一個綜合性的miRNA靶基因數(shù)據(jù)庫,收錄了Human、Mouse、Rat、Dog、cow等多個物種的miRNA靶基因信息,不僅僅記錄了基因全長序列上的miRNA結(jié)合位點(diǎn),也會將其與已有的12個miRNA靶標(biāo)預(yù)測程序的預(yù)測結(jié)合信息集合進(jìn)行結(jié)合關(guān)聯(lián)。 DIANA tools http://diana.imis./DianaTools/index.php DIANA tools,是一個集合了miRNA和lncRNA相關(guān)研究的數(shù)據(jù)庫,目的是提供一種算法數(shù)據(jù)庫和軟件,用于在系統(tǒng)框架中解釋和歸檔數(shù)據(jù),范圍包括從深度測序數(shù)據(jù)的表達(dá)調(diào)控分析。該數(shù)據(jù)庫能夠分析miRNA與靶基因,miRNA與信號通路,miRNA與lncRNA的相關(guān)分析,以及自動分析數(shù)據(jù),并且可以直接根據(jù)序列(新miRNA)預(yù)測靶基因,我們還能夠查詢miRNA發(fā)表的相關(guān)文章,miRNA相關(guān)的啟動子、調(diào)控因子、轉(zhuǎn)錄因子內(nèi)容也是有的。 SomamiR http://compbio./SomamiR/home.php SomamiR是microRNA(miRNA)及其靶點(diǎn)中癌癥體細(xì)胞突變的數(shù)據(jù)庫,集成了多種類型的數(shù)據(jù),用于研究體細(xì)胞和種系突變對癌癥中miRNA功能的影響。數(shù)據(jù)庫還提供了存在miRNA靶序列體細(xì)胞突變與腫瘤相關(guān)的基因及其參與的通路。 miRNEST http://rhesus./mirnest/copy/ miRNEST是一個整合了動物,植物和病毒microRNA數(shù)據(jù)的綜合數(shù)據(jù)庫,這是一個集成的microRNAs資源。數(shù)據(jù)庫的核心部分是作者根據(jù)225種動物和202種植物的表達(dá)序列標(biāo)簽(EST)進(jìn)行的miRNA預(yù)測。其中包括生效的miRNA序列,小RNA測序數(shù)據(jù),表達(dá),多樣性,靶標(biāo)數(shù)據(jù)和進(jìn)入外部miRNA資源的鏈接。 TargetScan http://www./vert_72/ TargetScan是一款預(yù)測miRNA結(jié)合位點(diǎn)的軟件,對于哺乳動物中miRNA結(jié)合位點(diǎn)預(yù)測的效果很好。在預(yù)測miRNA靶基因之前,首先需要確定轉(zhuǎn)錄本的3’UTR區(qū)域,TargetScan數(shù)據(jù)庫通過一種名為3P-seq的測序技術(shù),確定轉(zhuǎn)錄本對應(yīng)的3’UTR區(qū)(哺乳動物中的miRNA通過結(jié)合轉(zhuǎn)錄本序列的3’UTR區(qū),從而發(fā)揮轉(zhuǎn)錄后調(diào)控作用),并且結(jié)合該技術(shù)的分析結(jié)果和NCBI中已有的3’UTR注釋,提供一個綜合的3’UTR區(qū)序列。 miRcode http ://bioinfo.life.hust.edu.cn/lncRNASNP miRcode-基于全面的GENCODE基因注釋,提供了“整個轉(zhuǎn)錄組”人類microRNA靶標(biāo)預(yù)測,覆蓋完整的GENCODE注釋的轉(zhuǎn)錄組,包括10419條已經(jīng)注冊的lncRNA,轉(zhuǎn)錄本注釋來源于Gencode v11版本,并將轉(zhuǎn)錄本劃分成了不同類別.miRcode還涵蓋了編碼基因,包括非典型區(qū)域,例如5'UTR和CDS。miRcode與TargetScan相比,主要增加了ncRNA和非3’UTR區(qū)的檢索。 第三單元 circRNA數(shù)據(jù)庫 環(huán)狀RNA(circRNA)是一類特殊的非編碼RNA分子(在活體中有時也有表達(dá)),也是RNA領(lǐng)域最新的研究熱點(diǎn)。與傳統(tǒng)的線性RNA(linear RNA,含5’和3’末端)不同,circRNA分子呈封閉環(huán)狀結(jié)構(gòu),不受RNA外切酶影響,表達(dá)更穩(wěn)定,不易降解。大概在2010年開始,RNA-seq技術(shù)的發(fā)展以及專門的計(jì)算管道開發(fā),引爆了circRNA 研究。以下是針對circRNA的數(shù)據(jù)庫: circBase http://www./ circBase 是一個環(huán)狀RNA的數(shù)據(jù)庫,收錄多個物種的circRNA信息,采用了find_circ軟件來預(yù)測去核糖體文庫中的circRNA,數(shù)據(jù)庫可以單個環(huán)狀和列表形式對環(huán)狀RNA進(jìn)行搜索,還可以把全部環(huán)狀RNA下下來,部署到本地服務(wù)器上面,還可以像UCSC一樣使用序列進(jìn)行blat比對。 CIRCpedia v2 http://www./rnomics/circpedia CIRCpedia v2是一個更新的綜合數(shù)據(jù)庫,其中包含來自六個不同物種(人、大小鼠、果蠅、斑馬魚)的180多個RNA-seq數(shù)據(jù)集的circRNA注釋,識別262782個環(huán)狀RNA。還可以通過物種,細(xì)胞系,基因名稱或者基因組位置,circpedia中的circRNA進(jìn)行檢索,數(shù)據(jù)庫會給出環(huán)狀RNA ID來源基因,對應(yīng)的線性轉(zhuǎn)錄本,表達(dá)量,外顯子的起始和終止位置,細(xì)胞系,保守性等信息,并可以用熱圖或者散點(diǎn)圖的形式展現(xiàn)環(huán)狀RNA在不同組織或者細(xì)胞系中的表達(dá)量。 circRNADisease http://:9091/circRNADisease/ circRNADisease是基于已有實(shí)驗(yàn)驗(yàn)證的circRNA和疾病關(guān)聯(lián)的在線數(shù)據(jù)庫,系統(tǒng)地核實(shí)了800多個已發(fā)表的文獻(xiàn),并收集整理了330種circRNA和48種疾病。circRNADisease中的每個條目均包含有關(guān)circRNA-疾病關(guān)聯(lián)的詳細(xì)信息,包括circRNA和疾病名稱,circRNA表達(dá)模式,以及關(guān)于circRNA的簡要功能說明和其他注釋信息,注釋物種主要是人。 |
|