摘要:cBioPortal提供了這樣一種網(wǎng)絡(luò)資源:探索,可視化和分析多維度癌癥基因組數(shù)據(jù)。這個(gè)門戶網(wǎng)站把癌組織和細(xì)胞系還原成分子表達(dá)譜數(shù)據(jù),再到可以理解的遺傳的(基因的),表觀遺傳的,gene expression和蛋白events。查詢交互界面整合用戶的數(shù)據(jù)可以使研究者交互探索不同samples,genes,pathways的遺傳學(xué)上的改變,假如暗含的數(shù)據(jù)可行,還可以聯(lián)系到臨床結(jié)果。這個(gè)網(wǎng)站還提供gene水平的圖形總結(jié),從多平臺(tái),網(wǎng)絡(luò)可視化分析,生存分析,病人為中心的查詢,和軟件編程入口。直觀的網(wǎng)站交互界面使得復(fù)雜的癌癥基因組profiles對(duì)沒有生物信息學(xué)專業(yè)只是的研究者和臨床工作者可行,這樣就促進(jìn)了生物學(xué)發(fā)現(xiàn)。這里,我們提供一個(gè)可操作的guide來分析和可視化cBioPortal的特征(對(duì)癌癥基因集的)。Introduction大規(guī)模的癌癥基因組計(jì)劃,比如The cancer genome atlas(TCGA) and the International cancer genome consortium(ICGC),正在從多技術(shù)平臺(tái)產(chǎn)生更多的癌癥基因組數(shù)據(jù)。這使得這些數(shù)據(jù)的整合,探索和分析越來越具有挑戰(zhàn)性,尤其是對(duì)于沒有計(jì)算機(jī)背景知識(shí)的科學(xué)家來說。cBioPortal是專門設(shè)計(jì)來降低對(duì)這些復(fù)雜數(shù)據(jù)的接近門檻,因此,促進(jìn)基因組數(shù)據(jù)向新的生物學(xué)視野,治療和臨床特征的轉(zhuǎn)變。 這個(gè)網(wǎng)站,促進(jìn)多維度癌癥基因集數(shù)據(jù)的探索,可以允許跨gene,樣本和數(shù)據(jù)類型的可視化分析。用戶可以可視化一個(gè)癌癥研究中多樣本間基因改變的模式,并比較點(diǎn)多癌癥研究中g(shù)ene改變頻率,或者在一個(gè)個(gè)體腫瘤樣本中總結(jié)概括所有的相關(guān)的基因組改變。這個(gè)網(wǎng)站也支持生物通路探索,生存分析,基因改變間的相互獨(dú)特性分析,可選擇性的數(shù)據(jù)下載,編程接口和可以用于發(fā)表的可視化總結(jié)。 整合進(jìn)cBioPortal的基因組數(shù)據(jù)類型包括體細(xì)胞突變,DNA copy-number alterations(CNAs),Mrna和microRNA(miRNA)表達(dá),DNA甲基化,蛋白質(zhì)富集,磷酸化蛋白富集。目前,網(wǎng)站包含從10個(gè)出版的癌癥研究的數(shù)據(jù)集,包括癌癥細(xì)胞系百科全書,多于20個(gè)研究在TCGA流程。對(duì)沒有一個(gè)腫瘤樣本,數(shù)據(jù)是可以從多基因組數(shù)據(jù)分析平臺(tái)可獲取的。網(wǎng)站的簡(jiǎn)化概念是在基因水平整合多種數(shù)據(jù)類型,然后詢問每個(gè)sample中專門的生物學(xué)事件的呈現(xiàn)(例如,基因突變,基因純和刪除,基因擴(kuò)增,上調(diào)或下調(diào)的mRNA或miRNA),蛋白的上下調(diào)等。這使得用戶可以查詢每個(gè)gene和每個(gè)樣本的的遺傳學(xué)改變,并檢驗(yàn)復(fù)發(fā)(某些特殊癌癥)。 需要的設(shè)備個(gè)人計(jì)算機(jī),可以聯(lián)網(wǎng),已經(jīng)安裝java 注意:一下瀏覽器已經(jīng)被實(shí)驗(yàn)可行,google chrome,firefox,safari,ie9.0 需要安裝adobe flash player http://get.adobe.com/flashplayer/ Java 可以下載http://www./getjava/ Adobe pdf 閱讀器http://get.adobe.com/reader/ Vector graphic editor 這個(gè)可以可視化和編輯在cBioPortal下載的SVG file(OncoPrints)。支持這種軟件的是Adobe Illustrator (http://www.adobe.com/products/illustrator.html) and Inkscape (http:///) 說明cBioPortal的基因datasets可以獲取或下載,通過使用交互web 界面,也可以通過程序下載。 用戶可以選擇查詢單一癌癥研究或across癌癥研究。也可以查看個(gè)體癌癥樣本的相關(guān)的基因改變。 查詢個(gè)人癌癥研究在單一癌癥查詢中,用戶可以探索,可視化,選擇的gene中的基因改變,包括所有選擇的samples中的這些gene的改變之間的關(guān)系,和同一個(gè)gene 在不同數(shù)據(jù)類型之間的關(guān)系。執(zhí)行單個(gè)癌癥研究的查詢需要四步,見下圖1??傮w過程和特殊的查詢都在下面顯示了。 用戶可以從超過165個(gè)cancer studies進(jìn)行選擇(這里文章剛發(fā)表的時(shí)候是25個(gè)研究,可見網(wǎng)站發(fā)展只迅速)。 figure 1.jpg 這一項(xiàng)的選擇和之前也有變化,上面劃勾的兩個(gè)是默認(rèn),一個(gè)是突變,一個(gè)是推斷的gene copy數(shù)變異。當(dāng)可選的時(shí)候,相關(guān)的mRNA或miRNA表達(dá)或相關(guān)的蛋白和磷酸化蛋白富集數(shù)據(jù)也可以被選擇。蛋白和磷酸化蛋白數(shù)據(jù)基于的是reverse phase protein array(RPPA)實(shí)驗(yàn)。對(duì)于mRNA或miRNA數(shù)據(jù)和蛋白,磷酸化蛋白數(shù)據(jù),z 分?jǐn)?shù)是從表達(dá)值預(yù)先計(jì)算。用戶可以自定義閾值或使用默認(rèn)值(偏離均值2 SDs)。mRNA的z分?jǐn)?shù)由每個(gè)sample決定,是通過比較一個(gè)gene的Mrna表達(dá)值相對(duì)參考population中的分布(可以代表這個(gè)gene的典型分布)。如果正常的臨近組織中的表達(dá)數(shù)據(jù)可以獲得,這些數(shù)據(jù)就會(huì)被用來作為reference population。否則,所有腫瘤的表達(dá)值二倍于這個(gè)gene的被使用。miRNA表達(dá)譜或蛋白豐度的z分?jǐn)?shù)由每個(gè)sample決定,通過比較各自的所有樣本的miRNA或蛋白數(shù)據(jù)。 figure 2.jpg 定義上面這個(gè)case sets分析的時(shí)候,缺省選擇是match選擇的基因表達(dá)譜。例如,有sequencing data 的cases會(huì)被選擇,假如只查詢突變的話。然而,用戶可以通過下拉菜單改變這個(gè)選擇,這個(gè)單是有可獲得的數(shù)據(jù)定義的(例如,tumors with mutations,CAN data,gene expression,RPPA data)或由已知的腫瘤亞型決定。用戶可以輸入感興趣的特殊的cases,通過選擇“user-defined case list”或建立一個(gè)用戶定義的case set基于臨床特征,這個(gè)在“build case set”對(duì)話中。 FIgure 3.jpg 當(dāng)輸入gene sets分析的時(shí)候,用戶可以手工輸入HUGO gene symbols,Entrez gene ids,gene aliase或從預(yù)先定義的自己感興趣的gene sets或pathways中選擇。如果對(duì)一個(gè)給定的cancer 研究,循環(huán)的gene列表可以獲得,例如,在mutsig中的不斷改變的突變genes或GSITIC中不斷改變的突變genes,那么用戶也可以從這些列表中選擇genes,當(dāng)然也可以使用這些列表構(gòu)建gene sets或從這寫列表中手動(dòng)添加genes。 FIgure 4.jpg Fig. 1. Performing a query of a single cancer study The four steps to query genomic data in the cBioPortal for Cancer Genomics for a single cancer study. The query page is accessed from the site's home page. All queries must include at least one gene. The query shown is the one used to generate the results shown in Figs. 2and 3. 查看和結(jié)果解讀下面是我自己的結(jié)果。Liver cancer 所用gene是投稿的五個(gè)gene 5.jpg 下面這個(gè)是原文中的圖 6.jpg Fig. 2. The OncoPrint tab The example shows a visual summary of the different mechanisms of RB pathway alteration across a set of glioblastoma samples based on a query of the three genes CDKN2A, CDK4,and RB1. The OncoPrint tab summarizes genomic alterations in all queried genes across a sample set. Each row represents a gene, and each column represents a tumor sample. Red bars indicate gene amplifications, blue bars are homozygous deletions, and green squares are 第一個(gè)面板oncoprint行代表gene,列代表samples。圖標(biāo)和顏色代表代表不同的基因型改變,包括突變,CNAs(amplifications擴(kuò)增,homozygous deletions純合子缺失),基因或蛋白豐度改變。把鼠標(biāo)放到每一個(gè)小標(biāo)志上,可以看到關(guān)于caseID(代表一個(gè)病人sample或cell line)等的詳細(xì)信息,點(diǎn)擊樣本號(hào)可以進(jìn)入該sample的詳細(xì)信息,包括年齡性別還有g(shù)ene等詳細(xì)情況。對(duì)于突變evens,這顯示了氨基酸的改變。默認(rèn)情況下,cases按alterations進(jìn)行排序。用戶可以重新排序,比如字母,caseID,等。用戶也可以選擇移除未改變的cases從可視化圖中。通過可視化一系列cases中的gene改變,oncoprints可以幫助鑒定比如gene sets中的相斥或共發(fā)生事件。 上面這個(gè)例子中,這三個(gè)genesCDKN2A,CDK4,RB1,。65cases(71%)在這三個(gè)genes中至少有一個(gè)發(fā)生了改變。每個(gè)gene的突變頻率都顯示出來了。對(duì)于CDKN2A來說,大多數(shù)的改變是純合子缺失,CDK4是擴(kuò)增。RB1相關(guān)的包括1個(gè)純合子缺失和mutations。這三個(gè)gene的改變?cè)趕amples中的分布幾乎是相互排斥的狀態(tài),這可以進(jìn)行統(tǒng)計(jì)學(xué)分析和用mutual exclusivity tab進(jìn)行可視化。后面會(huì)解釋這個(gè)面板。 -1.一旦submit按鈕按下,oncoprint結(jié)果會(huì)自動(dòng)顯示。 -2.如果genes不適合window,會(huì)有水平滑動(dòng)條。 -3.為了讓oncoprint更緊湊,有三個(gè)選擇可以進(jìn)行自定義,(i)使用zoon bar進(jìn)行尺度縮小放大(ii)通過選擇view下去反選“show unaltered cases”移除沒有改變的cases(iii)反選view下的show whitespace between columns移除samples之間的gaps。如下圖 7.jpg -4. 在sort中改變顯示順序5 8.jpg -5.可以輸出oncoprint,選擇下載成xml文件,in scalable vector graphic(SVG)格式 9.jpg -6.若要獲得額外的詳細(xì)信息,那就動(dòng)下你的鼠標(biāo)到小標(biāo)志上面吧。 -7.如果想修正或開始查詢,選擇結(jié)果面板上的“modify query” 第二個(gè)面板Mutual exclusivity下面這是新版查詢結(jié)果(2017.10.03) 10.jpg 下面是原始文章中的 11.jpg Fig. 3. The Mutual Exclusivity tab The example shows that genes that alter RB signaling in glioblastoma have a tendency toward mutual exclusivity. This tab provides summary statistics on mutual exclusivity and co-occurrence of genomic alterations in each pair of query genes. In this example, all three pairs have a tendency toward mutual exclusivity. Although the CDK4-RB1 pair has the strongest tendency toward mutual exclusivity (dark blue background), the relationship is not statistically significant (P = 0.11). The mutual exclusivity is significant for the other two gene pairs (P < 0.05, red outline). The P values are determined by a Fisher's exact test with the null hypothesis that the frequency of occurrence of a pair of alterations in two genes is proportional to their uncorrelated occurrence in each gene. 癌癥中的生理過程或pathways經(jīng)常通過不同的genes或多個(gè)不同的機(jī)制從而失調(diào)。Mutual exclusivity(互斥)的概念可以用了鑒定預(yù)先不知道的機(jī)制,而這個(gè)機(jī)制可能助于癌癥發(fā)生和癌癥進(jìn)展。在互斥中,和某一特殊癌癥相關(guān)的genes傾向于在一系列癌癥中互斥。也就是說,每一種tumor很可能只有一種genetic events。相反的狀態(tài)(co-occurrence)是,同一個(gè)癌癥sample中,genetic 改變發(fā)生在很多genes中。我們的網(wǎng)站計(jì)算一系列簡(jiǎn)單的統(tǒng)計(jì)學(xué)來鑒定互斥或共發(fā)生的模式。對(duì)于每對(duì)查詢的gene(G1和G2),portal計(jì)算一個(gè)odds ratio(比值比),這個(gè)比值比揭示這兩個(gè)genes在選擇的cases中是相互排斥還是共發(fā)生。公式如下: 0.jpg A代表兩個(gè)genes都發(fā)生改變的cases數(shù)目 B代表G1改變G2沒變的cases數(shù)目 C代表G2改變G1沒變的cases數(shù)目 D代表兩者都沒發(fā)生改變的cases數(shù)目 然后把每一對(duì)genes指派到五個(gè)范疇中的一個(gè),預(yù)示互斥或共表達(dá),或沒聯(lián)系。分析的說明已經(jīng)提供了。為了鑒定每對(duì)gene pair的關(guān)系的重要性,網(wǎng)站執(zhí)行費(fèi)希爾精確檢驗(yàn)。 使用的查詢參數(shù)和oncoprints中描述的一樣?;コ夥治鲲@示了選擇的三個(gè)gene傾向于互斥的方式存在,但是這種模式只對(duì)CDKN2A和CDK4,CDKN2A和RB1合適,對(duì)CDK4和RB1不合適,這可能是因?yàn)闃颖拘?。這適合GBM中RB信號(hào)通路的解釋。RB信號(hào)通路可以,通過RB1本身的去激活(通過圖表或純合子缺失)而導(dǎo)致RB信號(hào)通路失活,通過擴(kuò)增激活CDK4(這個(gè)CDK可以一直RB1活性),或通過CDK抑制劑p16的去激活(缺失或突變),而這個(gè)抑制劑有CDKN2A編碼。這樣,這些genes中的單個(gè)gene的改變足夠讓RBpathway失活,這就是互斥分析所展示的。 第三個(gè)面板plotscBioPortal提供了集中不同的ways來可視化discrete genetic events(CNAa或突變),和連續(xù)的events,比如關(guān)于mRNA或蛋白豐度的data,或DNA甲基化數(shù)據(jù)。 對(duì)于query中定義的單個(gè)gene,portal可以產(chǎn)生不同的plots,依賴于數(shù)據(jù)的可獲得性。 mRNA vs copy-number選項(xiàng)展示了box-and-whisker plot來顯示mRNA表達(dá),數(shù)據(jù)來源與用戶選擇的每個(gè)樣本的數(shù)據(jù)源??截悢?shù)狀態(tài)可以純合子刪除,雜合子刪除,二倍體,gained(意味著相對(duì)少copies的擴(kuò)增事件),擴(kuò)增(意味這很多拷貝的擴(kuò)增事件)。Mrna vs DNA 甲基化選項(xiàng)展示了mRNA表達(dá)譜相對(duì)于所有選擇的samples的DNA甲基化的散點(diǎn)圖。甲基化貝塔值用來評(píng)估CpG locus的甲基化水平,使用的是密度比率,在甲基化和未甲基化位點(diǎn)之間的。RPPA蛋白水平vs mRNA選項(xiàng)顯示的是某個(gè)gene的蛋白豐度和mRNA豐度的比較(所有選擇的samples中)。 Genes和data types選項(xiàng)(現(xiàn)在在左側(cè))通過下拉菜單選擇,并且只有適合當(dāng)前數(shù)據(jù)的類型才會(huì)出現(xiàn)。所有的plots可以作為PDF輸出用于出版。 下面這個(gè)例子中用的是顯示查詢選項(xiàng)ERBB2的分析,這是一個(gè)在colon和rectum中已知的促癌gene,編碼的是表皮生長(zhǎng)因子受體。 12.jpg The example shows ERBB2 mRNA expression is increased in samples with DNA amplification, and ERBB2 protein abundance is higher in samples with increased mRNA. (A) A plot showing the relationship between ERBB2 mRNA abundance and CNA in the ERBB2 gene in tumors from the selected cancer study. The “x”s indicate individual tumors, and the circles indicate tumors with missense mutations. (B) A plot showing the relationship between the abudance of the ERBB2 protein and mRNA in samples from the selected cancer study. Homdel, homozygously deleted; Hetloss, heterozygously deleted; Diploid, two alleles present; Gain, low-level gene amplification event; Amp, high-level gene amplification event; Mutated, nonsynonymous mutation; Normal, no mutation or CNA present. ERBB2在colorectal癌癥samples中amplified。上圖結(jié)果顯示,ERBB2 mRNA在ERBB2擴(kuò)增的samples中是增加的fig4A。并且,mRNA最高的ERBB2tumors有最高數(shù)量的ERBB2蛋白豐度(Fig.4B)。 具體步驟如下-1.執(zhí)行Fig4中的條件,submit -2.選擇plots 面板 -3.在第一個(gè)Data type菜單選擇“Mrna expression(microarray)” 改進(jìn):在horizontal axis中的profile type中選copy number Profile name選擇putative copy-number alternation from GSITIC -4.第二個(gè)data type 菜單選擇“putative copy-number alternations from GISTIC” 改進(jìn):在vertical axis中,profile type選Mrna Profile name 選相應(yīng)的即可 -5.在plot type menu中選擇“Mrna v copy number” 改進(jìn):沒有這一項(xiàng)了,圖可以自動(dòng)生成 -6.按下箭頭可以產(chǎn)生fig4A 改進(jìn):箭頭可以改變橫縱坐標(biāo) -7.可以輸出為PDF格式 -8.plot type 菜單可以選擇“RPPA protein level v. mRNA” 改進(jìn):這個(gè)沒有了,都在profile type里 -9.按arrow按鈕可以產(chǎn)生Fig.4B 注意:如果組合不能被plot被選擇,會(huì)有錯(cuò)誤信息。 改進(jìn):現(xiàn)在不能組合,單獨(dú)生成 第四個(gè)面板mutations突變這個(gè)面板提供兩個(gè)細(xì)節(jié),一個(gè)是圖形總結(jié)一個(gè)是用戶可自定義修改的table,這都是關(guān)于每個(gè)query gene條件下鑒定的所有的all nonsynonymous mutations.圖形展示的是在pfam 蛋白域(由經(jīng)典的基因isoform編碼)的context中所有的的位置和頻率。所有的DNA突變被標(biāo)準(zhǔn)化到canonical RefSeq isoform(using Oncotator, http://www./oncotator/)。當(dāng)一個(gè)DNA 突變僅影響到非經(jīng)典isoforms,這個(gè)圖表就不被包括在圖形中。將來的版本將提供一個(gè)專門的表格來記錄這種信息。 圖的下面是所有非同突變的表。這個(gè)table,可以進(jìn)行分類和篩選,如果data可以獲取,那有下面信息會(huì)被提供:每個(gè)sample的caseID(可以超鏈接到病人view page,包含突變信息);氨基酸改變,突變的類型(missense錯(cuò)義突變,nonsense無義突變,splice site剪切位點(diǎn),frameshift insertion or deletion框移插入或缺失,in-frame insertion or deletion框內(nèi)插入或缺失,不終止nonstop,不開始nonstart).COMIC(Catalogue of somatic mutations in cancer)中這個(gè)位置的突變數(shù)目。錯(cuò)義突變的預(yù)測(cè)的功能改變(可以超鏈接到mutation assessor),link到3D結(jié)構(gòu)帶有突變高亮(超鏈接到mutation assessor),突變狀態(tài)(體細(xì)胞或生殖細(xì)胞-生殖細(xì)胞圖表目前只提供某些研究中BRCA1和BRCA2),已經(jīng)證實(shí)的狀態(tài)(有效或未知),sample被sequenced和突變鑒定的序列中心,這種tumor中突變的等位基因頻率,匹配的normal sample中突變的等位基因頻率,確切的基因組位置(染色體,start,end,reference allele,variant allele),突變的和參考的等位基因reads(在tumor和normal sample的sequencing 結(jié)果中發(fā)現(xiàn)的突變和reference alleles的數(shù)目),受影響的isoform的信息。最后這三個(gè)默認(rèn)不顯示,但可以設(shè)置顯示。用戶可以perform 搜表中的任何text。 13.jpg Fig. 5. The Mutations tab To generate these results, the query was limited to mutations for ERBB2 in the indicated cancer study. Four of the 10 ERBB2 mutations in colorectal cancer occur in a hotspot in the kinase domain. (A) The graphical view shows the Pfam protein domains and the positions of specific mutations. The length of the line connecting the mutation annotation to the protein is indicative of the number of samples that have the mutation. The most recurrent mutations are labeled in the graphical view. (B) The tabular view provides additional information about all mutations in each query gene. 實(shí)例中展示的ERBB2的分析,用的是colon和rectum adenocarcinoma only sequenced tumors。這個(gè)圖顯示,在colorectal 癌癥samples中,有10個(gè)ERBB2非同義突變,其中四個(gè)是V842I在kinase domain,這顯示了這是一個(gè)蛋白激活熱點(diǎn)。從這個(gè)表中,激酶domain圖表在氨基酸755,777,和842已經(jīng)在幾種其他癌癥studies中被觀測(cè)到。(看氨基酸位點(diǎn)可以鼠標(biāo)放圖上) 14.jpg 具體步驟如下 -1,執(zhí)行Fig.5的搜索條件 -2.選擇mutation tab -3.鼠標(biāo)劃過代表蛋白domains的顏色區(qū)域,view關(guān)于這個(gè)domain的細(xì)節(jié)和他的開始和結(jié)束氨基酸殘基(這個(gè)蛋白質(zhì)sequence) -4.鼠標(biāo)劃過蛋白序列圖上的圓圈就是那個(gè)綠點(diǎn),看具體的突變信息。連接circle到蛋白的線的高度顯示了突變的頻率。突變頻率最高的以他的氨基酸改標(biāo)注,例如那個(gè)v842I. -5.通過使用“columns”可以自定義table中的顯示,選擇想顯示的,反選hide的。 -6.使用上下箭頭可以對(duì)data進(jìn)行排序(根據(jù)column值) -7.follow caseID超鏈接,可以得到關(guān)于tumor sample的細(xì)節(jié)(包含突變信息) -8.使用瀏覽器后退按鈕可以回到mutations tab。 -9.鼠標(biāo)劃過cosmic列的值,可以得到這個(gè)殘基的突變頻率和個(gè)體信息 -10.鼠標(biāo)劃過FIS列的值,追隨超鏈接到mutation assessor或mutiple sequence alignment。 -11.點(diǎn)擊3D 可以鏈接到3D蛋白結(jié)構(gòu),突變的氨基酸高亮顯示,使用瀏覽器back可以回到mutation tab。 -12.搜索框內(nèi)輸入“V842I”(沒有引號(hào)),可以僅顯示V842I突變。 -13.若想再次全部展示,把12搜索框中輸入的刪除即可。 第五個(gè)面板 protein changes蛋白質(zhì)和磷酸化蛋白data在protein changes tab可以獲得。來自RPPA平臺(tái)的大規(guī)模蛋白組數(shù)據(jù)有12個(gè)TCGA cancer studies在網(wǎng)站可以獲得(table s1)。如之前描述的,對(duì)于查詢gene的蛋白質(zhì)豐度對(duì)mRNA的散點(diǎn)圖可以生成,前提是這兩種數(shù)據(jù)都有(Fig.4B,Plots tab)。 對(duì)每一個(gè)查詢來說,網(wǎng)站也會(huì)為所有可獲取的RPPA蛋白數(shù)據(jù)執(zhí)行不同的分析,并鑒定和查詢的gene有關(guān)的發(fā)生遺傳學(xué)改變的蛋白和磷酸化蛋白。 在查血screen不一定非要選擇“RPPA protein/phosphoprotein level”。如果數(shù)據(jù)可以獲得,那么,這個(gè)分析可以被執(zhí)行。對(duì)可獲得蛋白和磷酸化蛋白,cBioPortal執(zhí)行一個(gè)雙側(cè),雙樣本學(xué)生t檢驗(yàn)來鑒定tumor samples(查詢的gene中至少有一個(gè)有alternation)之間的蛋白豐度差異。結(jié)果以一列蛋白和磷酸化蛋白list展示,根據(jù)在altered和未altered samples中間的蛋白豐度差異進(jìn)行排序。這個(gè)table包含下列信息: 抗體可以識(shí)別的靶蛋白;磷酸化或修飾的殘基(比如,切割);腫瘤中發(fā)生改變的平均蛋白豐度z分?jǐn)?shù);p值;可選擇是否畫出結(jié)果圖,這個(gè)默認(rèn)顯示。RPPA ID和未改變和改變的樣本間的平均z分?jǐn)?shù)之間的絕對(duì)差異是可選擇列。對(duì)每一個(gè)蛋白或磷酸化蛋白,改變和未改變的samples之間的RRPA數(shù)據(jù)的z分?jǐn)?shù)可以box圖展示。 下面這個(gè)結(jié)果展示的是,和glioblastoma cancer 突變和copy 數(shù)目有關(guān)的腫瘤抑制和脂質(zhì)磷酸化蛋白,由PTEN編碼。Fig.6。例如,glioblastoma cancer中PTEN 缺失(突變或copy number deletion),和AKT(pT308和Ps473)的磷酸化緊密聯(lián)系在一起。Fig.6。 步驟如下 1.如下圖Fig.6所示的條件,perform 2.選擇protein changes tab(這里不出現(xiàn)這個(gè)面板,不知道是改進(jìn)還是) 3.使用antibody type的下拉菜單,來限定使用抗體收集的數(shù)據(jù),來檢測(cè)所有的蛋白或磷酸化蛋白 4.自定義table中顯示的data,使用show/hide columns菜單。選擇和反選。 5.press plot中的+ 符號(hào)展示盒裝圖,比較samples之間的z分?jǐn)?shù)和豐度,有差異的沒差異的(查詢的gene或多個(gè)gene) 6.輸入ERBB(沒有引號(hào))在搜索框,展示ERBB2和ERBB3的磷酸化改變。 7.刪除搜索文字可以返回完整結(jié)果。 15.jpg Fig. 6. The Protein Changes tab When available in the cancer study selected, results related to protein or phosphoprotein abundance are provided through this tab. In this example, glioblastoma (GBM) samples with alterations in PTEN have increased phosphorylated AKT. (A) Phosphoproteins with different amounts when comparing PTEN-altered samples and PTEN-wild-type samples. The list is sorted by P values from a two-sample t-test. (B) Boxplot representation of the relative amount of AKT pT308 in PTEN-altered and PTEN-wild-type samples. This plot is generated by clicking the icon in the Plot column of the tabulated data. 第六個(gè)面板 survival如果生存數(shù)據(jù)可以獲得,那么tumor samples(查詢的gene至少有一個(gè)在腫瘤sample發(fā)生改變)之間的整體的生存和無病生存差異會(huì)被計(jì)算。這個(gè)結(jié)果以帶有p值的Kaplan-Meier圖展示(from logrank test)。 例子展示的ovarian cancer中BRCA1和BRCA2的突變。這個(gè)分析展示了BRCA1或BRCA2突變有明顯更好的總體和無病生存期。 步驟如下 1.執(zhí)行如Fig.7的條件。 2.選擇Survival 面板 3.查看總體生存期分析和免疾病生存期分析結(jié)果 4.可以下載pdf等格式文件。 (備注,現(xiàn)在都是上下展示,以前是并列) 16.png Fig. 7. The Survival tab The example shows the overall survival (A) and the disease-free survival (B) of ovarian cancer patients with or without BRCA1 or BRCA2 mutations. The red curves in the Kaplan- Meier plots includes all tumors with a BRCA1 or BRCA2 germline or somatic mutation, the blue curves includes all samples without a BRCA1 or BRCA2 mutation. 第七個(gè)面板Network這個(gè)network tab提供了cancer中改變的相互作用分析和網(wǎng)絡(luò)可視化。Network包含pathways和來自HPRD(Human Reference Protein Database),Reactome,NCI-nature(National Cancer Institue)和Memorial Sloan-Kettering Cancer Center(MSKCC) Cancer Cell Map (http://cancer.), 的相互作用,源自于open source Pathway Commons Project.默認(rèn)下,網(wǎng)絡(luò)自動(dòng)生成,包含所有的查詢gene的所有鄰居(臨近節(jié)點(diǎn))。If網(wǎng)絡(luò)中有多于50個(gè)neighbor genes存在,他們會(huì)根據(jù)在所選擇的癌癥中的genomic alternation 頻率進(jìn)行排序,并且除了查詢的genes,只有最高改變頻率的50個(gè)neighbors展示。(only the 50 neighbors with the highest alternation frequency in addition to the query genes are shown).這對(duì)哪里網(wǎng)絡(luò)的復(fù)雜性和自動(dòng)高亮和查詢的癌癥有關(guān)的genes非常有幫助。這個(gè)完整的未經(jīng)修剪的網(wǎng)絡(luò)可以SIF和GraphML格式下載,在cytoscape中進(jìn)一步可視化和分析。默認(rèn)情況下,網(wǎng)站會(huì)自動(dòng)根據(jù)相互作用的類型對(duì)邊加以顏色區(qū)分,并且每一個(gè)點(diǎn)覆蓋基因組data,高亮突變,CAN,mRNA上調(diào)下調(diào)頻率高的gene。顯示的數(shù)據(jù)和查詢中的設(shè)置有關(guān),并且,也和選擇的genomic profiles可行性有關(guān)??梢杂貌煌倪x擇對(duì)網(wǎng)絡(luò)進(jìn)行過濾,并且可以根據(jù)gene symbol對(duì)網(wǎng)絡(luò)就行搜索。不同的選擇都會(huì)改變這個(gè)網(wǎng)絡(luò)的展示,同時(shí)結(jié)果自動(dòng)改變。解釋網(wǎng)絡(luò)符號(hào)的說明都有提供。Genes之間的改變的和相互作用的細(xì)節(jié)通過點(diǎn)擊nodes和edge都可以進(jìn)行查看。相互作用的類型源自于BioPAX到SIF 規(guī)則。例如,“In Same Componet”揭示的是Genes A和B 涉及同樣的BC,例如complex?!癝tate Change”說明Gene A引起一種狀態(tài)改變,比如Gene B的磷酸化改變?!癘ther”用于說明所有內(nèi)部作用的其他類型,包括來于HPRD的蛋白蛋白相互作用?!癟argeted by drug”說明drug-target相互作用。 Portal包含gene為中心的drug-target信息,來源一下resources:DrugBank,KEGG Drug,NCD cancer Drugs(http://www./cancertopics/druginfo/alphalist),Rask-Andersen,Rask-Andersen) 等。Drugs在網(wǎng)絡(luò)中隱藏,默認(rèn)顯示但可以使用genes & drugs菜單添加進(jìn)網(wǎng)絡(luò)。用戶可以選擇展示U.S Food 和Drug Administration(FDA)-approved drugs,被NCI Cancer Drugs定義的癌癥藥物,或者靶向查詢genes的所有藥物。 通過選擇當(dāng)前網(wǎng)絡(luò)的genes可以生成網(wǎng)絡(luò),然后把這些genes當(dāng)作新的query進(jìn)行提交。 例如,為了發(fā)現(xiàn)serous ovarian cancer中EGFR信號(hào)通路網(wǎng)絡(luò)基因組的改變,我們使用EGFR和ERBB2作為查詢genes來探索結(jié)果網(wǎng)絡(luò)。如Fig.8.使用顏色密碼作為指引,這種癌癥正發(fā)生變化的連接gene非常明顯。對(duì)于EFGR和ERBB2網(wǎng)絡(luò)MYC,一個(gè)已知的ERBB2下游效應(yīng)子 ,顏色很紅,因?yàn)樗趏varian cancer samples中擴(kuò)增30%(Fig.8)。 通過添加drug data,gefitinib和erlotinib,這兩個(gè)都是已知的酪氨酸激酶抑制劑,它們靶向EGFR的催化結(jié)構(gòu)域,還有cetuximab和trastuzumab,這兩個(gè)是monoclonal抗體,分別靶向EGFR和ERBB2的胞外結(jié)構(gòu)域,用邊顯示連接到它們的靶標(biāo)Fig.8A。 具體步驟如下 -1.Fig8的條件執(zhí)行查詢 -2.選擇 network tab -3.從genes & Drugs tab選擇“show all drugs” (備注,現(xiàn)在在右邊的genes下的“drugs of specified genes”) -4.從顯示按鈕,選擇“l(fā)ayout properies”,并且設(shè)置最大距離到100來縮短邊的距離 17.jpg -5.從layout button,選擇“perform layout” -6.filtering 網(wǎng)絡(luò)后,自動(dòng)執(zhí)行l(wèi)ayout changes,選擇“auto layout on changes” -7.設(shè)置‘filter neighbors by alteration’到10 -8.通過單擊和重置nodes對(duì)nodes進(jìn)行重排,以便更好的輸出 -9.雙擊MYC node可以查看基因組profile details -10.從view菜單,選擇“highlight neighbors”,然后選擇“remove highlights”來重置所有nodes和edges -11.view和過濾相互作用類型和sources in the interactions tab -12.雙擊line,鏈接flavopiridol到EGFR的線,可以查看細(xì)節(jié) -13.反選“merge ineractions”來顯示nodes之間不同作用類型的多個(gè)邊 -14.從view button,選擇“always show profile data”來可視化每個(gè)gene周圍的不同基因譜的變化頻率,反選可以去除。 -15.在“topology”button選項(xiàng)可以隱藏或顯示選擇的nodes或移除網(wǎng)絡(luò)中沒有鏈接的nodes。 -16.從genes & drugs選擇EGFR,ERBB2,MYC,單擊箭頭提交新的查詢 -17.使用瀏覽器back按鈕回到上一級(jí)結(jié)果 -18.下載GraphML或SIF可以在類似cytoscape的軟件中進(jìn)行進(jìn)一步分析。 下面這個(gè)圖是最新版的圖,2017.10.04 18.jpg 現(xiàn)在的gene legend QQ圖片20180726134125.png 下面的是原文里的圖 20.jpg Fig. 8. The Network tab The example shows network analysis of EGFR networks in serous ovarian cancer. (A)Network view of the EGFR and ERBB2 neighborhood in serous ovarian cancer (TCGA dataset) rendered with Cytoscape Web (34).The query genes, EGFR and ERBB2, are outlined with a thick border, and nearest neighbor genes are color-coded by their alteration frequency in ovarian cancer. One can display drugs that target EGFR or ERBB2 (hexagons; orange indicates FDA-approved), as well as details about genomic alterations and links to external resources for any gene in the network (bottom left, example MYC). (B) The “Gene Legend” accessed from the “Legend” button. Mousing over any gene in the network or single-clicking the gene displays multidimensional genomic data (copy number, mutation, and mRNA expression) onto all nodes in the network. (C) The “Interaction Legend” accessed from the “Legend” button. Double-clicking the edge displays additional details about the interaction between the two nodes. Edges can represent different interaction types (color-coded, such as “reacts with”). (D) Options for filtering, cropping, and searching the network are shown. 第8-10個(gè)面板:IGV,Download,bookmarkDownload tab提供所有的基因組數(shù)據(jù)下載和每個(gè)樣品的alteration的下載。 用戶可以下載tab-delimited text 文件,帶有所有查詢gene的數(shù)據(jù)或者僅僅需要的一些文件以便進(jìn)一步分析。 Tab-delimited text文件兩種形式可以獲?。╥)矩陣,行代表gene,列代表samples(ii)轉(zhuǎn)置矩陣,也就是行代表samples,列代表genes 用戶也可以可視化copy number細(xì)節(jié),通過選擇開始一個(gè)web start version of IVG. IVG可以打開當(dāng)前癌癥研究的分割的拷貝數(shù)data并顯示所有查詢genes的拷貝數(shù)狀態(tài)。 Bookmark tabBookmark tab運(yùn)行用戶保存或標(biāo)簽專門的query(整個(gè)的query可以儲(chǔ)存在URL形式)或通過生成短的URL(使用bit.ly)和同時(shí)一起分享結(jié)果 步驟如下 1.執(zhí)行任何的query 2.從IGV tab,點(diǎn)擊launch 按鈕加載data,開始viewer Note:所有samples的分割的copy-number data在IGV中可以可視化,無論那個(gè)cases被選擇來查詢 3.在Download tab,獲取tab-delimited格式的data,單擊超鏈接查看獲得的文件或打開URL在新tab或窗口。然后“select all”拷貝進(jìn)電子表格或選擇file,然后“save page as”存儲(chǔ)為text file 4.從Download tab,把data放進(jìn)電子表格或生成file手動(dòng)的,復(fù)制粘貼每個(gè)text box中的data進(jìn)入choise program 5.從Bookmark tab,右擊link 粘貼進(jìn)瀏覽器產(chǎn)生個(gè)人bookmark或存儲(chǔ)鏈接到一個(gè)專門的query 6.從bookmark tab,press “shorten URL” 產(chǎn)生短的URL通過使用bit.ly (為特意查詢) Note通過點(diǎn)擊短的link或長(zhǎng)版本可以加載bookmark頁(yè)面。 執(zhí)行cross-cancer 查詢Cross-cancer queries允許用戶估計(jì)單個(gè)gene或多個(gè)gene在多種不同的癌癥類型間的改變頻率和突變data??绨┌Y的mRNA表達(dá)或蛋白豐度data目前還不可行。網(wǎng)站會(huì)自動(dòng)限制這種研究搜索以匹配到查詢參數(shù),這樣只有帶有mutation 信息的data包括進(jìn)僅含突變的query并且只有帶有CAN的data信息被包含在CAN-only 查詢。結(jié)果以直方圖形式呈現(xiàn): -(i)一個(gè)顯示這些癌癥中的改變頻率,以降序排列 -(ii)一個(gè)顯示每個(gè)癌癥研究中,帶有和不帶有改變的samples的絕對(duì)number,這可以以帶有改變的數(shù)目下降的order進(jìn)行。展現(xiàn)。如果多個(gè)genes被查詢,那么直方圖會(huì)展示綜合的改變或改變頻率(包含所有的選擇的gene)。關(guān)于查詢的genes的細(xì)節(jié)在oncoprints也有體現(xiàn)。這樣使得每種癌癥研究的每個(gè)選擇的gene的結(jié)果都可以可視化。 一個(gè)關(guān)于TP53的cross-cancer研究,這個(gè)gene編碼腫瘤抑制gene和轉(zhuǎn)錄調(diào)控子p53,顯示了cBioPortal的特性(Fig.9A)步驟如下 -1.主查詢page(Home)選擇“All Cancer Studies”. 備注,新版這個(gè)已經(jīng)變了。直接在下圖中select all 即可 21.jpg -2.選擇“only mutation” Note: 這會(huì)自動(dòng)不查詢限制到只有mutation data的癌癥研究中。 -3.輸入感興趣的gene或genes -4. press “submit” -5.press “sort” link 組織數(shù)據(jù),從發(fā)生突變頻率最高到最低的順序排列。(Fig.9B),也可以按字母順序排列 -6.左上角Y-Axis value 那里有個(gè)下拉框,可以按突變頻率排序也可以按absolute counts排序。 -7.鼠標(biāo)劃過任何bar都可以看到結(jié)果的詳細(xì)信息 -8.鼠標(biāo)左擊任何列表的bar可以查看選擇的genes在該cancer中的oncoprints 22.jpg (A) Users initiate a query against all cancer studies in three steps. (B) The results are displayed as a histogram of the alteration frequencies of the query gene (or genes) across cancer studies. The example shows that TP53 mutation frequencies are the highest in squamous cell carcinomas of ovary, lung, and head and neck. 查看癌癥研究summary data除了執(zhí)行特異gene queries,cBioPortal還提供access to 包含在portal中的每個(gè)癌癥研究的總結(jié)。可獲得數(shù)據(jù)包括每個(gè)病人的不同的臨床details(生存和診斷時(shí)的年齡),關(guān)于tumor的細(xì)節(jié)(histology,stage,grade),遺傳學(xué)data的總結(jié)(非同源突變的數(shù)目,基因組改變的fraction),復(fù)發(fā)的突變gene的細(xì)節(jié),復(fù)發(fā)的CNAs的細(xì)節(jié)。臨床數(shù)據(jù)的呈現(xiàn)既可以有圖也可以有table(Fig.10). 突變的gene和CNAdata以tables的形式展現(xiàn)。所有的table都有搜索選項(xiàng)。搜索queries所有內(nèi)容(caseIDs,gene symbols,臨床特征),可以包含短語(yǔ)。步驟如下 -1.HOME選擇“Uterine Corpus Endometroid Carcinoma (TCGA, Provisional)” -2. 1111.jpg 摁那個(gè)summary按鈕??醇?xì)節(jié) -3.新版已經(jīng)不適應(yīng) -4.鼠標(biāo)放圖上可以看相關(guān)details -5.轉(zhuǎn)到clinical data可以通過點(diǎn)擊arrowheads對(duì)每列進(jìn)行排序。 -6. 在紅色框里輸入deceased可以查看已故的人的信息 Note:搜索病人data的table不會(huì)更新選擇的病人的圖的data。 -7.刪除搜索框內(nèi)的text可以對(duì)整個(gè)cases的列表進(jìn)行重排 -8.點(diǎn)擊“copy number alterations” 可以獲得染色體區(qū)域列表和帶有CNAs的基因的列表 -9.點(diǎn)擊“mutated genes”可以獲得循環(huán)的突變的genes列表 -10.點(diǎn)擊列表gene的任何一個(gè)可以執(zhí)行新的突變查詢(指定的癌癥指定的突變) -11.無用 -12.現(xiàn)在graph發(fā)生了很大變化。但總體多了。把鼠標(biāo)放到餅圖的扇形區(qū)域,點(diǎn)擊,整個(gè)界面都會(huì)發(fā)生變化,和點(diǎn)擊的扇形區(qū)域有關(guān)。 -13. 第12步選擇的條件都會(huì)在上方有顯示,然后可以逐一清除,也可以clear all,這樣就可以restore所有的plots和table。 23.jpg 下面是新版的圖。 24.jpg 下面這個(gè)是原始文章的圖 25.jpg Fig. 10. The cancer study summary view The example shows an overview of clinical attributes and a scatter plot of mutation count versus fraction of genome altered for each case in the TCGA endometrial cancer study. 查看單個(gè)腫瘤的基因組改變:patient view在任意一個(gè)腫瘤sample中,都有潛在的可能發(fā)生上百或上千的基因組改變,對(duì)于選擇,檢查和分析,那些對(duì)癌癥發(fā)生或影響治療的反應(yīng)的改變的事件,就極其重要。因此,除了跨越許多samples,不同tumor types和癌癥研究總結(jié)data,除了gene-by-gene 改變地圖,用戶也可以查看個(gè)體tumor sample的基因組改變,在一個(gè)交互式病人view page。在oncoprint(對(duì)每一個(gè)基因組event可以鼠標(biāo)看細(xì)節(jié))可以看到這些鏈接,除了在oncoprint,還可以在mutations tab,cancer study summary page也可以看到。 病人查看界面總結(jié),可視化關(guān)于tumor的所有相關(guān)數(shù)據(jù),包括臨床特征,突變和拷貝數(shù)變異程度總結(jié),關(guān)于突變,擴(kuò)增和刪除gene的細(xì)節(jié)(Fig.11)。這個(gè)結(jié)果以tabbed displays展示??偨Y(jié)tab中的基因組改變以以下條件進(jìn)行過濾 跨越tumor集合的突變或CNAs復(fù)發(fā)(frome MutSig 和GISTIC),COSMIC中的圖表發(fā)生,癌基因注釋(比如sanger cancer gene census)。也提供關(guān)于藥物和靶標(biāo)的信息。步驟如下 -1.頂部的導(dǎo)航pane點(diǎn)擊“DATA SETS”按鈕。 26.jpg -2.點(diǎn)擊“Uterine Corpus Endometrioid Carcinoma (TCGA, Provisional).” 這一步的效果和上面那個(gè)點(diǎn)那個(gè)柱狀圖效果一樣。 -3.搜索框內(nèi)輸入“TCGA-FI-A2D2” 點(diǎn)擊右邊紅色框后,會(huì)出現(xiàn)左邊的框,然后在左邊那個(gè)紅色框里輸入 27.jpg 實(shí)際是執(zhí)行下步,也就是需要點(diǎn)擊那個(gè)小人 28.jpg -5.忽略 -6.鼠標(biāo)劃過mutations和CNA tables 的列頭獲得更多關(guān)于每列的信息 29.jpg Fig. 11. The cBioPortal patient view The example shows the relevant genomic alterations and clinical data of an endometrial cancer sample with mixed histology from the TCGA study. 30.jpg |
|