聽(tīng)生信群里大神閑聊,說(shuō)他自己的師弟做了個(gè)TCGA可視化工具,我就點(diǎn)開(kāi)鏈接看了一下,不點(diǎn)開(kāi)就算了,一點(diǎn)開(kāi)不得了,
就像我手上的錘子手機(jī),千萬(wàn)別用,用了就無(wú)法回頭。
TCGA相關(guān)的數(shù)據(jù)庫(kù)有很多,
但我最關(guān)心的功能只有三個(gè),差異表達(dá),生存分析,相關(guān)性分析,這也是我篩選課題的一個(gè)方向
- 能夠差異表達(dá)是前提
- 如果這時(shí)候還跟生存相關(guān),那就錦上添花了,
- 通過(guò)相關(guān)性分析找出他的朋友們,所謂物以類聚,看看這個(gè)人的朋友基本上就知道他是什么樣子的人
有一個(gè)恐怖的傳說(shuō)一直讓我后背冒汗心里起火:你的工資是跟你密切交往的6個(gè)朋友的平均值,朋友居然重要到這個(gè)層面。
好了,不鬼扯,我們簡(jiǎn)單介紹一下這個(gè)數(shù)據(jù)庫(kù)GEPIA(Gene Expression Profilling Interactive Analysis),翻譯一下應(yīng)該是
基因表達(dá)譜數(shù)據(jù)動(dòng)態(tài)分析。
http://gepia./index.html
這個(gè)數(shù)據(jù)庫(kù)是北京大學(xué)開(kāi)發(fā)的,沒(méi)有發(fā)文章,沒(méi)有發(fā)文章。
This tool is developed by Zefang Tang, Chenwei Li and Boxi Kang of Zhang Lab, Peking University.
我要學(xué)學(xué)寶劍叔叔右哉,先擬定一個(gè)讓你痛心的場(chǎng)景,藍(lán)后一步一步幫你解決, 這可能有助于我們直接解決問(wèn)題。
假設(shè),
你現(xiàn)在已經(jīng)研二了,之前放浪形骸,行散神也散,現(xiàn)在木有課題,木有魚(yú)丸,明年要畢業(yè)了,藍(lán)后沒(méi)有管你
也沒(méi)有男女朋友,沒(méi)有大師兄,沒(méi)有沙師弟,你該怎么辦呢?
我們可以這樣,先找出某個(gè)特定癌癥中跟生存最相關(guān)的一串基因,再來(lái)慢慢篩選,正好GEPIA有這個(gè)功能。
先點(diǎn)擊一下Survival Analysis,依次點(diǎn)擊
點(diǎn)擊list會(huì)出現(xiàn)下面的結(jié)果,可以查詢,可以翻頁(yè),可以一個(gè)個(gè)復(fù)制粘貼用以前講的方法做GO分析,KEGG分析,互作分析??梢钥纯催@個(gè)
無(wú)代碼芯片分析圖文教程:每個(gè)人都可以做一做的生信第1題
這里我們直接選擇VADC1來(lái)看看,首先我們檢查一下這個(gè)基因分生存分析圖究竟是什么樣子,點(diǎn)擊它
這時(shí)候相當(dāng)于進(jìn)入了單基因入口,這里面給出了這個(gè)基因概括,說(shuō)是線粒體膜的主要組成成分,也跟鐵的轉(zhuǎn)運(yùn)相關(guān),我覺(jué)得都是熱門方向
如果這個(gè)領(lǐng)域你hold不住,就返回去再換一個(gè)基因點(diǎn)進(jìn)來(lái),最右邊圖我覺(jué)得很直觀,綠色代表VDAC1在正常組織的表達(dá),紅色代表在腫瘤組織中的表達(dá)
可能這張圖看不出啥特殊,我舉個(gè)例子,
A基因幾乎只在乳腺表達(dá),而且在乳腺癌中明顯高表達(dá)
B基因在全身廣泛表達(dá),但是表達(dá)風(fēng)度不高,而在乳腺癌中表達(dá)顯著提高
好了頁(yè)面往下拉就可以看到這個(gè)基因在多個(gè)癌癥癌和癌旁的表達(dá)情況,我們可以看出他在乳腺癌中是高表達(dá)的
但是在其他許多癌癥中也明顯差異表達(dá),這張表不會(huì)讓你漏掉其他癌癥,如果恰巧實(shí)驗(yàn)室有人在做那個(gè)癌癥,你就可以跟他合伙搞一搞嘛。
因?yàn)槟銢](méi)有人管,沒(méi)有大師兄,沒(méi)有沙師弟,你還有什么選擇?
此外,你是可以選擇呈現(xiàn)方式的,按照如下步驟操作可以得到漂亮的癌和癌旁的表達(dá)圖
點(diǎn)擊plot之后是這個(gè)樣子的,可以下載,可以直接放在文章里面
返回一開(kāi)始的界面,往下面翻一翻就會(huì)看到和這個(gè)基因表達(dá)類似的基因
哎呦歪,里面HNRNPAB就是核內(nèi)不均一核糖核蛋白家族成員,他可是要調(diào)控RNA的可變剪切的,許多LNCRNA作pulldown后就會(huì)拉下這個(gè)家族的成員
相關(guān)的文章從SCIENCE,CELL到ONCOTARGETS都有。
但是我們差點(diǎn)忘了進(jìn)來(lái)是干什么的,我們是來(lái)看生存分析的。依次操作。
點(diǎn)擊plot就會(huì)得到下面的圖
這個(gè)圖真的是漂亮,一點(diǎn)都不含糊,好了這時(shí)候課題基本上就有苗頭了
VDAC1以暫時(shí)不知道的原因升高導(dǎo)致乳腺癌的發(fā)生,而乳腺癌患者高表達(dá)VADAC1的患者低生存
知道這些信息如何設(shè)計(jì)課題呢?可以看看這個(gè)
課題設(shè)計(jì):收不完的病人查不完的房,臨床醫(yī)生如何快速地設(shè)計(jì)一個(gè)靠譜的課題?
臨床醫(yī)生做科研不外乎診和療
- 從診治的角度來(lái)說(shuō),這個(gè)基因表達(dá)水平對(duì)診斷乳腺癌有沒(méi)有幫助?
- 從治療的角度來(lái)說(shuō),既然高表達(dá)低生存,那么有沒(méi)有可能設(shè)計(jì)抗體來(lái)治療乳腺癌呢?
當(dāng)然那個(gè)是轉(zhuǎn)化醫(yī)學(xué),在這之前就是基礎(chǔ)醫(yī)學(xué)
從研究的角度來(lái)看:
- 這個(gè)基因高表達(dá)的原因是什么?表觀遺傳相關(guān)么,突變么,轉(zhuǎn)錄激活么,翻譯修飾么,搞清楚就已經(jīng)不容易了。
我們?cè)囈辉嚤碛^遺傳有沒(méi)有影響,在UCSC數(shù)據(jù)庫(kù)中打開(kāi)VDAC1,我的媽呀,他的啟動(dòng)子區(qū)域這么洶涌澎湃的H3K27ac修飾,說(shuō)明他的表達(dá)量本身就很高,不大可能是個(gè)壞分子,要么就是他在癌中突變了,要么就是他啟動(dòng)子在癌癥中被過(guò)度激活了,我只是說(shuō)可能
那么就會(huì)有個(gè)子課題產(chǎn)生:
H3K27ac組蛋白乙?;揎棿偈筕DAC1基因啟動(dòng)子激活從而升高其表達(dá)
- 另外一個(gè)問(wèn)題,這個(gè)基因在乳腺癌中的功能是什么?
可以嘗試用生物信息學(xué)找到共表達(dá)的基因,之前已經(jīng)列出來(lái)了,再去預(yù)測(cè)他可能有什么功能,
也可以直接構(gòu)建慢病毒shRNA敲減后看看他的表型,
可是這不是你想要的,我們需要的是短平快,怎么辦呢?查文獻(xiàn),
恰好我剛知道那個(gè)寫(xiě)過(guò)Hallmars of Cancer這篇文章老爺爺Weinberg在nature發(fā)表了一篇文章,時(shí)間是2017年3月30日,他們找到了乳腺癌中一個(gè)新的抑癌基因
叫做LACTB,他能夠調(diào)控脂質(zhì)代謝抑制乳腺癌,LACTB是一個(gè)線粒體相關(guān)的蛋白,VDAC1也是個(gè)線粒體相關(guān)的蛋白,他們之間可能有聯(lián)系么?
他們的聯(lián)系可能多種多樣,我們嘗試用現(xiàn)成的工具看一下,相關(guān)性分析
點(diǎn)擊plot試一下
居然他們還有相關(guān)性,歡天喜地慶豐收,畢業(yè)在望??墒撬麄兯麄儜?yīng)該表達(dá)呈負(fù)相關(guān)才合理呀,
這么來(lái)把這些結(jié)果整合到一起呢?VDAC1和LACTB相關(guān),抑制癌癥的產(chǎn)生,藍(lán)后不知怎么的他的啟動(dòng)子就過(guò)度活化了
然后他就促發(fā)了癌癥?
我覺(jué)得自己都說(shuō)服不了,我們還是換一種思路吧,用string數(shù)據(jù)庫(kù)來(lái)看一看
VDAC1居然跟BAX,BCL2L1相關(guān),表明其可能跟細(xì)胞的凋亡相關(guān)
好了最終的課題就是
H3K27ac修飾使VDAC1的啟動(dòng)子過(guò)度乙酰化促進(jìn)其表達(dá)從而抑制細(xì)胞凋亡促進(jìn)乳腺癌的發(fā)展。
我覺(jué)得這時(shí)候真的可以搞一搞了,什么,你沒(méi)有shRNA?
不是說(shuō)了跟別人合作么,你怎么又搞忘了。
藍(lán)后檢索一下VDAC1和乳腺癌的文章,發(fā)現(xiàn)少之又少,開(kāi)始吧。
這個(gè)過(guò)程中好像文獻(xiàn)閱讀并不重要,但是不要忘了LACTB是Weinberg文章里面的
LACTB在乳腺癌中的表達(dá)和調(diào)控還沒(méi)有研究呢,上面那個(gè)課題要是實(shí)在弄不好,就換這一個(gè)吧。
Note: 表觀遺傳那一塊我是不嚴(yán)謹(jǐn)?shù)?,?yīng)該選乳腺的數(shù)據(jù)看看修飾,ENCODE數(shù)據(jù)庫(kù)就支持。
藍(lán)后,我覺(jué)得科研結(jié)果的呈現(xiàn)最基本的要求就是
自洽
四個(gè)字就是自圓其說(shuō),不要前后矛盾,你自己構(gòu)建了一個(gè)體系,一定要讓自己信服。
自己都不相信的東西還想讓別人相信,你把我當(dāng)什么了。