解螺旋公眾號·陪伴你科研的第2570天 RNA-蛋白結合預測數(shù)據(jù)庫 “老板給了我一個RNA,讓我找直接作用機制,我該這么辦?” “先用catRAPID數(shù)據(jù)庫看一下與它結合的蛋白吧!” “這個數(shù)據(jù)庫怎么用?。俊?/span> “看這里呀!” catRAPID數(shù)據(jù)庫(http://service./page/catrapid_group)的開發(fā)者來自西班牙的 Universitat Pompeu Fabra,數(shù)據(jù)庫相關文章(PMID: 21623348)于2011年6月發(fā)表在Nature Methods雜志(2019IF=30.822)上。截至2021-05-13該數(shù)據(jù)庫相關文章已引用135次(數(shù)據(jù)來源:PubMed)。 開發(fā)者們利用多肽和核苷酸鏈的物理化學性質(二級結構、氫鍵和范德華力)評估蛋白質和RNA的相互作用,分為catRAPID fragments、catRAPID strength、catRAPID omics、catRAPID express、catRAPID signature和catRAPID interactions with large RNAs六個模塊。其中最重要的就是catRAPID omics模塊了,該模塊可以計算模型生物的分子(蛋白質/轉錄物)和參考集(轉錄物/核苷酸結合蛋白質)之間的相互作用。 換句話說,就是這個模塊可以用已知RNA來預測相互作用的蛋白,也可以用已知的蛋白來預測相互作用的RNA。 catRAPID omics模塊 在主頁點擊對應的超鏈接即可進入該模塊的頁面。 因為我們是已知RNA,則選擇相應的第2個項目。 我們以RepA為例,輸入序列即可。 然后有關于預測細節(jié)的3個設置,根據(jù)自己的需要設置即可。郵箱是可選項,如果不輸入郵箱的話記得不要關閉頁面。 待網頁運算完成之后刷新頁面即可得到結果。 首先是根據(jù)星級的統(tǒng)計餅狀圖。可以看到我們的結果絕大部分未中等星級。 星級評定系統(tǒng)幫助用戶對結果進行排名。分數(shù)是三個單獨值的總和:catRAPID標準化傾向、RNA/DNA結合域和無序區(qū)域的存在以及已知RNA結合基序的存在。 1)catRAPID標準化傾向:交互傾向在0和1之間線性標準化,并乘以分布分數(shù)。 2)RNA/DNA結合域和無序區(qū)域:蛋白質區(qū)域的得分如下:RNA域=1,DNA域=0.5,無序=0.5,DNA域+無序=1。 3)已知的RNA結合基序:基序的存在被賦值為1,否則賦值為0。 接下來是結果的完整列表。表中一共有9列,從左至右依次為編號、蛋白ID、RNA ID、Z值、區(qū)分能力、交互傾向、蛋白結構域、RNA基序和星級評定。 1)編號:就是結果的順序編號。 2)蛋白ID:就是預測到的蛋白,點擊會進入到UniProt網站的相應蛋白頁面。 3)RNA ID:就是我們輸入的RNA,點擊會顯示該RNA的序列。 4)Z值:在catRAPID omics模塊中,使用兩個參考數(shù)據(jù)集計算的平均值(23.25)和標準偏差(37.90)對Z評分進行標準化。 5)區(qū)分能力:用來評估快速交互傾向,它代表了預測的可信度,范圍從0%(不可預測性)到100%(可預測性)。高于50%的DP值表示可能發(fā)生相互作用,而高于75%表示高置信度預測。 6)交互傾向:是一個蛋白質(或區(qū)域)和一個RNA(或區(qū)域)之間相互作用概率的度量,是基于觀察到的核糖核蛋白復合物的組成部分表現(xiàn)出其物理化學特征的趨勢。 7)蛋白結構域:是通過分析帶有DNA和RNA相關術語注釋的Pfam匹配的蛋白質序列來進行鑒定的,并利用IUPred算法對蛋白質序列進行分析,識別無序區(qū)域。 8)RNA基序:RNA結合蛋白及其相關識別基序的圖譜來自公開數(shù)據(jù)庫(RBPDB和SpliceAid-F)和相關文獻。點擊會顯示相應的詳細基序信息及相應的證據(jù)來源。 9)星級評定:如前所述是一個綜合性評分。 catRAPID express模塊 當我們通過catRAPID omics確定了與RNA和相互作用的蛋白,我們還想進一步了解一下二者具體的精細結合位點,那么catRAPID express就派上了用場。 在主頁點擊對應的超鏈接即可進入該模塊的頁面(需要注意的是目前僅支持物種為人)。 根據(jù)自己的需要選擇相應的項目,這里我們以第一個來演示。 之后是輸入序列,與catRAPID omics類似,我們以NOP56和TSC2為例。 結果顯示我們輸入的蛋白質RNA分子相關的相關系數(shù)為0.79,下方有二者的熱圖,及之前catRAPID omics也會有的一些信息。點擊熱圖后方的(png)可直接下載熱圖。 下面是匹配結果和組織表達信息。匹配結果顯示了我們輸入的序列在Ensembl網站的匹配結果,這里我們的匹配結果都是100%。組織表達則顯示了蛋白和RNA在不同人組織中的表達情況。 怎么樣,這個數(shù)據(jù)庫是不是很好用啊,當你把你的結果交給你老板的時候,你老板也會被你驚艷到的。 一個竅門搞定生信創(chuàng)新性問題,也太太太太太太太簡單了吧! 醫(yī)學人體解剖手繪:科學與藝術交織的生命真實 收稿范圍廣泛的國人友好Q1區(qū)SCI雜志 領 悟 科 研 優(yōu) 人 一 步 |
|