本文的臨床數(shù)據(jù)的生存分析,并沒(méi)有使用TCGA數(shù)據(jù)庫(kù)里面的病人信息,而是自己收集病人樣本,記錄其臨床信息,隨訪時(shí)間等等。還采用IHC等病理技術(shù)手段來(lái)量化感興趣的基因的表達(dá)量情況,最后全部使用自己的數(shù)據(jù)做出來(lái)了下面的生存分析曲線。 因?yàn)樽髡卟](méi)有上傳這些臨床信息,所以呢,是不可能重復(fù)出來(lái)作者的生存分析曲線啦。不過(guò),我們的學(xué)徒任務(wù)是,去TCGA數(shù)據(jù)庫(kù),找到BRCA和CRC病人的該基因的表達(dá)量情況,對(duì)病人進(jìn)行分組后會(huì)在生存曲線,看看是否也是具有統(tǒng)計(jì)學(xué)顯著。 如果你感興趣研究團(tuán)隊(duì)的數(shù)據(jù)收集過(guò)程,也可以繼續(xù)讀文獻(xiàn): 可以看到病人隊(duì)列也不小了,兩個(gè)癌癥,每個(gè)一百多病人。研究者在檢查STING這個(gè)基因表達(dá)量的時(shí)候,區(qū)分了內(nèi)皮細(xì)胞和免疫細(xì)胞。這一點(diǎn)很有趣。 只有你對(duì)你的課題熟悉到一定程度才知道,并不是TCGA數(shù)據(jù)庫(kù)里面的RNA-seq或者芯片數(shù)據(jù)檢測(cè)到的STING這個(gè)基因表達(dá)量能區(qū)分生存就是你的生物學(xué)故事的證據(jù)支持。 臨床資料整理也詳細(xì)描述了病理技術(shù)的來(lái)龍去脈,使用的儀器和商業(yè)抗體信息。 臨床數(shù)據(jù)統(tǒng)計(jì)通常不使用R語(yǔ)言這里值得強(qiáng)調(diào)的是,其實(shí)臨床統(tǒng)計(jì)數(shù)據(jù)分析并不一定要使用R語(yǔ)言,甚至說(shuō),大部分都不會(huì)使用R語(yǔ)言完成統(tǒng)計(jì)分析。本文就是典型,使用的是收費(fèi)軟件,PRISM和SPSS。 臨床三線表是必須的這個(gè)我以前講解過(guò)使用R語(yǔ)言如何繪制 可以根據(jù)臨床信息細(xì)分為癌癥亞型后繼續(xù)生存分析因?yàn)檠芯繄F(tuán)隊(duì)收集的病人臨床信息比較全面,所以可以根據(jù) stage 這個(gè)信息,把病人繼續(xù)細(xì)分為3個(gè)分組后繼續(xù)進(jìn)行生存分析。 你的作業(yè)就是,使用TCGA數(shù)據(jù)源,制作本文里面的生存分析,看看顯著與否! |
|