一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

一篇文章帶你走進(jìn)單細(xì)胞的天地

 健明 2021-07-15

文獻(xiàn)詳解欄目


每個(gè)人的時(shí)間精力有限,必須優(yōu)先閱讀相關(guān)文獻(xiàn),開(kāi)設(shè)這個(gè)欄目也是希望為大家推薦高質(zhì)量的單細(xì)胞相關(guān)文獻(xiàn)。如果大家對(duì)單細(xì)胞轉(zhuǎn)錄組感興趣可以關(guān)注一下,哪怕每天只學(xué)一點(diǎn)點(diǎn),積土成山,積水成淵。

當(dāng)然一個(gè)人的力量終歸是小的,我也希望匯聚一群人,形成一個(gè)場(chǎng),這里頭最重要的生產(chǎn)力不是單個(gè)人多聰明,多厲害,而是每個(gè)人相互作用,形成的那個(gè)氛圍。

希望大家能有所收獲!

文章

文章發(fā)表于nature review genetics:Integrative single- cell analysis,作者是Tim Stuart與Rahul Satija。做過(guò)單細(xì)胞分析的對(duì)他們應(yīng)該都不陌生。

   摘要  

scRNA-seq技術(shù)的發(fā)展契合了研究個(gè)體細(xì)胞表觀(guān)遺傳、空間研究、蛋白質(zhì)組與譜系信息的方法需要,這為研究多類(lèi)型數(shù)據(jù)的綜合方法提出了獨(dú)特的機(jī)遇與挑戰(zhàn)。綜合分析可以發(fā)現(xiàn)細(xì)胞之間的模式關(guān)系,獲取細(xì)胞的整體狀態(tài)信息,產(chǎn)生涵蓋不同樣本與不同研究手段的數(shù)據(jù)集。該文重點(diǎn)討論了單細(xì)胞基因表達(dá)數(shù)據(jù)與其他類(lèi)型的單細(xì)胞分析方法的整合。


 一些 · 概念

多模態(tài)(Multimodal)數(shù)據(jù):多種類(lèi)型數(shù)據(jù)的組合,如RNA與蛋白質(zhì)數(shù)據(jù)組合,是一種多維度數(shù)據(jù),類(lèi)似多組學(xué)。

單模態(tài):?jiǎn)蝹€(gè)類(lèi)型數(shù)據(jù)

Pseudotime:擬時(shí)分析


聯(lián)合聚類(lèi)(Joint-clustering):通過(guò)聯(lián)合不同類(lèi)型數(shù)據(jù)對(duì)細(xì)胞進(jìn)行分組。


典型相關(guān)分析(CCA): 利用綜合變量對(duì)之間的相關(guān)關(guān)系來(lái)反映兩組指標(biāo)之間的整體相關(guān)性的多元統(tǒng)計(jì)分析方法。


動(dòng)態(tài)時(shí)間規(guī)整(Dynamic time warping):一種局部拉伸或壓縮兩個(gè)一維矢量以校正一個(gè)矢量相對(duì)于另一個(gè)矢量的滯后的方法。


MNNs:標(biāo)準(zhǔn)化基因表達(dá)空間中最臨近的細(xì)胞。聚類(lèi)用校正批次效應(yīng)。


梯度推進(jìn)(Gradient boosting):一種預(yù)測(cè)模型算法。

概述

隨著分子生物學(xué)、微流控與納米技術(shù)的發(fā)展,催生了許多類(lèi)型的單細(xì)胞測(cè)序技術(shù)。過(guò)去的方法集中在單模態(tài)測(cè)量上,如DNA序列、RNA表達(dá)量和染色質(zhì)可及性上。雖然這些技術(shù)促進(jìn)了我們對(duì)細(xì)胞多樣性與發(fā)育景觀(guān)的理解,但是它們并不能很好地解析單細(xì)胞內(nèi)分子間互作關(guān)系。而這些互作關(guān)系是深入探索細(xì)胞狀態(tài)的關(guān)鍵。此外,隨著可用數(shù)據(jù)集規(guī)模的快速增長(zhǎng),迫切需要用于標(biāo)準(zhǔn)化與聯(lián)合分析且考量到批次效應(yīng)與個(gè)體差異的計(jì)算方法。


scRNA-seq是應(yīng)用最為廣泛的單細(xì)胞測(cè)序技術(shù)之一。而后出現(xiàn)了一系列互補(bǔ)技術(shù)如單細(xì)胞基因組、表觀(guān)基因組和蛋白質(zhì)組分析技術(shù),涵蓋了單細(xì)胞基因組測(cè)序(
Vitak, S. A. et al., 2017; Navin, N. et al., 2011)、染色質(zhì)可及性(Pott, S., 2017; Corces, M. R. et al., 2016; Buenrostro, J. D. et al., 2015; Cusanovich, D. A. et al., 2015; Lake, B. B. et al., 2018)、DNA甲基化(Luo, C. et al., 2017; Smallwood, S. A. et al., 2014; Guo, H. et al., 2013; Mulqueen, R. M. et al., 2018)、膜蛋白(Stoeckius, M. et al., 2017; Peterson, V. M. et al., 2017)、小RNA(Faridani, O. R. et al., 2016)、組蛋白修飾(Gomez, D. te al., 2013; Rotem, A. et al., 2015)和染色體構(gòu)象(Ramani, V. et al., 2017; Nagano, T. et al., 2013)等技術(shù)。目前已開(kāi)發(fā)出研究單細(xì)胞空間結(jié)構(gòu)和譜系信息的方法(Frieda, K. L. et al., 2017; Shah, S. et al., 2016)。

單細(xì)胞多模態(tài)綜合分析方法示意

Multimodal and integrative methods for single- cell analyses


目前已有多種方法測(cè)定單細(xì)胞各個(gè)時(shí)期不同參數(shù),這些方法可以大致分為細(xì)胞狀態(tài)分析、細(xì)胞譜系分析、擬時(shí)分析三大類(lèi),圖中適用于不同類(lèi)型的分析方法均已標(biāo)注

單模態(tài)與多模態(tài)分析方法匯總


CEL-seq:線(xiàn)性擴(kuò)增測(cè)序法
CITE- seq:膜蛋白豐度與基因表達(dá)水平測(cè)定
G&T-seq:基因組轉(zhuǎn)錄組測(cè)序
LINNAEUS:譜系追蹤
MARS-seq:大規(guī)模平行單細(xì)胞RNA測(cè)序
MEMOIR:譜系與空間結(jié)構(gòu)測(cè)定
MERFISH:主要是細(xì)胞間結(jié)構(gòu)測(cè)定
osmFISH:環(huán)狀單分子熒光原位雜交,空間結(jié)構(gòu)測(cè)定
REAP- seq:膜蛋白豐度與基因表達(dá)水平測(cè)定
scATAC-seq:?jiǎn)渭?xì)胞空間結(jié)構(gòu)測(cè)定
scBS-seq:?jiǎn)渭?xì)胞甲基化測(cè)序
scChIP-seq:?jiǎn)渭?xì)胞ChIP-seq
scGESTALT:結(jié)合CRISPR-cas9的譜系追蹤弄方法
scHi-C-seq:測(cè)定染色體組裝
sciATAC-seq:結(jié)合index轉(zhuǎn)座酶的scATAC-seq
sci-CAR:利用index聯(lián)合分析mRNA和染色質(zhì)可及性譜
sci-MET:利用index分析單細(xì)胞甲基化水平
sci-RNA-seq:結(jié)合index的scRNA-seq
SCI-seq:?jiǎn)渭?xì)胞組合標(biāo)記測(cè)序,檢測(cè)CNV
scM&T-seq:?jiǎn)渭?xì)胞甲基化組和轉(zhuǎn)錄組測(cè)序,可研究未知的DNA甲基化與基因表達(dá)之間的關(guān)系
scNOMe- seq:核小體占位與甲基化組測(cè)序
scRRBS:?jiǎn)渭?xì)胞限制性代表區(qū)域甲基化測(cè)序
scTHS- seq:?jiǎn)渭?xì)胞轉(zhuǎn)座體超敏性位點(diǎn)測(cè)序
seqFISH:內(nèi)含子序貫熒光原位雜交,擴(kuò)展觀(guān)測(cè)到基因數(shù)量
snmC-seq:?jiǎn)魏思谆奏y(cè)序
SNS:?jiǎn)魏藴y(cè)序
SPLiT-seq:丐版scRNA-seq
STARmap:原位單細(xì)胞測(cè)序

理想的實(shí)驗(yàn)流程應(yīng)當(dāng)全面洞悉細(xì)胞的所有方面,包括分子狀態(tài)、空間構(gòu)象、胞外環(huán)境互作的全部過(guò)程。盡管當(dāng)下技術(shù)手段無(wú)法做到,但多模態(tài)技術(shù)與綜合計(jì)算方法可以是我們離該目標(biāo)越來(lái)越近。文章希望提出整合單細(xì)胞轉(zhuǎn)錄組學(xué)、基因組學(xué)、表觀(guān)組學(xué)與蛋白組學(xué)的數(shù)據(jù)統(tǒng)一分析方法,重點(diǎn)在結(jié)合其他數(shù)據(jù)類(lèi)型分析scRNA-seq數(shù)據(jù),尤其是整合來(lái)自于同一細(xì)胞的不同類(lèi)型數(shù)據(jù)。

文章分為四大塊,首先探討了多模態(tài)單細(xì)胞分析方法,其次研究了不同實(shí)驗(yàn)不同數(shù)據(jù)整合分析,然后討論了單細(xì)胞空間測(cè)序數(shù)據(jù)整合分析方法,最后給出了整合分析方法的前景與必要性。(本文中我把第二和第三塊的內(nèi)容合在了一起)

單細(xì)胞多模態(tài)測(cè)序方法

最初的單細(xì)胞分析方法主要關(guān)注細(xì)胞某狀態(tài)下的某類(lèi)分子水平。而現(xiàn)在更引人矚目的是同時(shí)分析單細(xì)胞內(nèi)多種分子以建立更全面的單細(xì)胞分子視圖。通常這些方法是將scRNA-seq數(shù)據(jù)與其它分析手段的結(jié)合,目前主要有四種策略從單細(xì)胞中得到多模態(tài)數(shù)據(jù):

1.1
FACS結(jié)合scRNA-seq

嚴(yán)格來(lái)說(shuō)這種方法算單模態(tài)。


一些scRNA-seq workflow采用流式分選細(xì)胞,隨后進(jìn)行scRNA-seq(MARS-seq/Smart-seq/2),這樣可以同時(shí)獲得單細(xì)胞與對(duì)應(yīng)的熒光信號(hào),將熒光所表示的蛋白質(zhì)水平與轉(zhuǎn)錄組在同一細(xì)胞中關(guān)聯(lián)(
Ramsk?ld, D. et al., 2012; Jaitin, D. A. et al., 2014; Picelli, S. et al., 2013 )。早期研究(Hayashi, T. et al., 2010)利用FACS結(jié)合半定量RT-PCR(作者稱(chēng)之為FBSC‐PCR),結(jié)合scRNA-seq,明確了細(xì)胞表面marker可以區(qū)分細(xì)胞類(lèi)型與狀態(tài)(Wilson, N. K. et al., 2015;該文結(jié)合了Smart-seq2),(Paul, F. et al., 2015;該文結(jié)合了MARS-seq)和鑒定稀有細(xì)胞的思路。Paul, F. et al., 2015Nestorowa, S. et al., 2016利用該workflow研究發(fā)現(xiàn)了小鼠造血祖細(xì)胞由轉(zhuǎn)錄組定義不同細(xì)胞簇的免疫表型,Wilson, N. K. et al., 2015則分離了小鼠HSCs,鑒定細(xì)胞維持干性相關(guān)的表面marker。但是囿于熒光光譜的重疊現(xiàn)象,利用該法測(cè)到的每個(gè)細(xì)胞的參數(shù)范圍有限。

1.2
  細(xì)胞內(nèi)組分分離分析

針對(duì)熒光無(wú)法分選的部分,F(xiàn)ACS顯然是不合適的,尤其是需要同時(shí)測(cè)得單細(xì)胞基因組與胞內(nèi)蛋白的scRNA-seq實(shí)驗(yàn)。此時(shí)需要物理分離或通過(guò)不同tag篩選出不同組分。

G&T-seq通過(guò)加入oligo(dT)特異性分離mRNA同時(shí)保留基因組DNA從而實(shí)現(xiàn)了基因組轉(zhuǎn)錄組平行測(cè)序(Macaulay, I. C. et al., 2015)DR-seq通過(guò)則通過(guò)加入barcode特異擴(kuò)增cDNA序列實(shí)現(xiàn)基因組轉(zhuǎn)錄組平行測(cè)序(Dey, S. S. et al., 2015)。這使得單細(xì)胞基因表達(dá)水平與其對(duì)應(yīng)基因型聯(lián)系起來(lái),深度揭示單細(xì)胞間DNA拷貝數(shù)變異與染色體重排對(duì)下游mRNA豐度的具體關(guān)聯(lián)。這些方法適用于研究體細(xì)胞基因高度變異的腫瘤組織。

DNA甲基化與轉(zhuǎn)錄組水平結(jié)合研究是基于Macaulay, I. C. et al., 2015的G&T-seq和 Smallwood, S. A. et al., 2014的scBS- seq技術(shù)發(fā)展的,同普通BSP一樣,用亞硫酸氫鈉處理DNA片段隨后進(jìn)行擴(kuò)增,結(jié)合G&T-seq,可以分析同一細(xì)胞內(nèi)的DNA甲基化模式和基因表達(dá)數(shù)據(jù)(Angermueller, C. et al., 2016)。由于DNA甲基化存在不穩(wěn)定性和異質(zhì)性,因此若要研究DNA甲基化與基因表達(dá)間的關(guān)系,則必須將表觀(guān)基因組變異與細(xì)胞間的異質(zhì)性區(qū)別開(kāi)來(lái)。
通過(guò)DNA甲基化與轉(zhuǎn)錄組關(guān)聯(lián)分析,為啟動(dòng)子甲基化與基因表達(dá)間的負(fù)相關(guān)性提供深層次的證據(jù)。此外,利用barcode系統(tǒng)選擇性標(biāo)記基因組DNA與cDNA,結(jié)合index系統(tǒng),可以對(duì)數(shù)千個(gè)單細(xì)胞進(jìn)行染色質(zhì)可及性與基因表達(dá)水平間的關(guān)聯(lián)分析,同時(shí)鑒定出影響基因表達(dá)的順式調(diào)控元件(Cao, J. et al., 2018)。

關(guān)于胞內(nèi)蛋白與mRNA關(guān)聯(lián)研究,有兩種思路可供借鑒。其一(Darmanis, S. et al., 2016)是將FACS sort到的細(xì)胞裂解后分離裂解液,分別進(jìn)行蛋白質(zhì)與RNA定量。作者采用PEA (鄰近探針延伸分析) 檢測(cè)蛋白并用RT-qPCR定量,采用qRT-PCR定量mRNA。該法可以同時(shí)檢測(cè)82個(gè)mRNA/75個(gè)蛋白;其二(Genshaft, A. S. et al.)是將FACS sort到的細(xì)胞在微流控芯片中同時(shí)進(jìn)行逆轉(zhuǎn)錄和PEA而不分離裂解液。該法可以同時(shí)檢測(cè)96個(gè)mRNA/38個(gè)蛋白。這兩種方法檢測(cè)的蛋白與mRNA數(shù)量與質(zhì)量均有限。

1.3
泛化測(cè)序數(shù)據(jù)統(tǒng)一


此處泛化統(tǒng)一是指將多種數(shù)據(jù)類(lèi)型(蛋白數(shù)據(jù)/譜系數(shù)據(jù)/基因表達(dá)數(shù)據(jù))整合為一個(gè)通用型數(shù)據(jù)類(lèi)型。
CITE-seq與REAP-seq可以同時(shí)將細(xì)胞表面膜蛋白信息與mRNA轉(zhuǎn)為cDNA信息,通過(guò)測(cè)序可以同時(shí)檢測(cè)到二者實(shí)際水平。具體是利用帶有polyA的不同barcode的抗體結(jié)合細(xì)胞表面蛋白,barcode可以與mRNA一起檢測(cè)。與FACS-scRNAseq相比,針對(duì)不同表位的不同抗體barcode都是特異的,可以從根本上消除熒光信號(hào)重疊對(duì)檢測(cè)數(shù)量的限制,這使得區(qū)分不同免疫細(xì)胞的細(xì)微差別成為可能。但是該法對(duì)于胞內(nèi)蛋白與mRNA共檢測(cè)是行不通的。作者認(rèn)為可以與PEA結(jié)合來(lái)解決這一問(wèn)題,或是采用SPLiT-seq、sci-RNA-seq的研究思路來(lái)解決。

這些技術(shù)的出現(xiàn)表明若將可以細(xì)胞信息轉(zhuǎn)化為有序的barcode,我們就可以在分析單細(xì)胞轉(zhuǎn)錄組時(shí)將這些信息同時(shí)獲取。這種策略不僅適用于分析細(xì)胞的自然狀態(tài),也適用于大規(guī)模基因擾動(dòng)研究。目前有Perturb-Seq(Dixit, A. et al., 2016)和CRISPR-Seq(Adamson, B. et al., 2016; Datlinger, P. et al., 2017; Jaitin, D. A. et al., 2016),他們將scRNA-seq與CRISPR-cas9結(jié)合進(jìn)行遺傳篩選,使得研究正向遺傳學(xué)的大規(guī)?;驍_動(dòng)試驗(yàn)成為可能。具體原理是給單個(gè)基因擾動(dòng)和受到影響的細(xì)胞添加barcode,通過(guò)scRNA-seq能夠鑒定出這兩者,從而推斷CRISPR靶向基因和由此產(chǎn)生的單個(gè)細(xì)胞的轉(zhuǎn)錄譜間的關(guān)系。目前應(yīng)用在基因調(diào)控網(wǎng)絡(luò)(Dixit, A. et al., 2016)、未折疊蛋白反應(yīng)(Adamson, B. et al., 2016)、免疫細(xì)胞分化發(fā)育(Datlinger, P. et al., 2017)和T細(xì)胞受體激活(Jaitin, D. A. et al., 2016),非編碼區(qū)調(diào)控元件(Klann, T. S. et al., 2017)。此外,還可以結(jié)合CRISPR-dcas9系統(tǒng),擴(kuò)展到轉(zhuǎn)錄調(diào)控、表觀(guān)遺傳調(diào)控領(lǐng)域中(Thakore, P. I. et al., 2016; Liu, X. S. et al., 2016; Hilton, I. B. et al., 2015; Konermann, S. et al., 2015; Gilbert, L. A. et al., 2017),18年發(fā)展了同時(shí)靶向和敲除基因的技術(shù)(Boettcher, M. et al., 2018)。

另一個(gè)應(yīng)用是結(jié)合CRISPR-cas9的譜系追蹤技術(shù)。單細(xì)胞譜系追蹤是去年的大熱方向之一,此處提到三種mRNA+lineage方法:scGESTALT、ScarTrace、LINNAEUS。這三種方法各有不同,但大體是利用CRISPR-cas9連續(xù)切割結(jié)合到基因組上的barcode,細(xì)胞會(huì)用NHEJ來(lái)應(yīng)對(duì)這種損傷。但NHEJ容易出錯(cuò),從而在DNA序列中產(chǎn)生隨機(jī)突變,這些突變通過(guò)細(xì)胞分裂進(jìn)行遺傳,結(jié)合scRNAseq利用這些突變作為復(fù)合barcode來(lái)構(gòu)建組織或器官發(fā)育譜系。

另一種略有不同的方法是MEMOIR,它結(jié)合smFISH與CRISPR-cas9系統(tǒng),可以同時(shí)檢測(cè)細(xì)胞譜系與空間位置。

1.4
scRNA-seq數(shù)據(jù)挖掘

普通的scRNA-seq流程除了可以做轉(zhuǎn)錄本豐度外,還可以進(jìn)行諸如體細(xì)胞突變、遺傳變異、RNA isoform等分析。

關(guān)于體細(xì)胞突變目前已有研究(Lodato, M. A. et al., 2015),該文通過(guò)對(duì)人大腦的少量單細(xì)胞全基因組測(cè)序,分析了發(fā)生的細(xì)胞突變,構(gòu)建了人大腦神經(jīng)細(xì)胞譜系。作者發(fā)現(xiàn)突變大多發(fā)生在高轉(zhuǎn)錄活性相關(guān)位置,這表明可能可以通過(guò)scRNA-seq數(shù)據(jù)來(lái)分析神經(jīng)細(xì)胞突變情況,根據(jù)轉(zhuǎn)錄狀態(tài)重構(gòu)神經(jīng)細(xì)胞譜系。此外,分析scRNA-seq數(shù)據(jù)中的拷貝數(shù)變異,可以研究癌癥非整倍體與異質(zhì)性等情況(Tirosh, I. et al., 2016; Fan, J. et al., 2018)。
單細(xì)胞分析也為理解DNA自然變異如何影響基因表達(dá)與細(xì)胞狀態(tài)提供了新思路。有研究結(jié)合GWAS+scRNAseq,鑒定出了不同個(gè)體之間的eQTL(Kang, H. M. et al., 2018)。

1.4
多模態(tài)數(shù)據(jù)分析

多模態(tài)測(cè)序策略正在催生與之相匹配的數(shù)據(jù)分析方法。多模數(shù)據(jù)集可以檢測(cè)到細(xì)胞間的細(xì)微差異,而單模數(shù)據(jù)很可能無(wú)法做到這一點(diǎn)。由于scRNAseq數(shù)據(jù)存在dropout,故而它更容易忽略細(xì)胞間的細(xì)微差別;但與來(lái)自同一細(xì)胞的其他數(shù)據(jù)互補(bǔ)分析可以改善這一問(wèn)題。例如,很難通過(guò)scRNA-seq數(shù)據(jù)區(qū)分不同的T細(xì)胞亞群,但聯(lián)合膜蛋白分析則可以顯著提高亞群分辨率(Stoeckius, M. et al., 2017),同樣,RNA+chromatin、RNA+methylation聯(lián)合可能揭示單個(gè)細(xì)胞間的調(diào)控異質(zhì)性,不再贅述。

單細(xì)胞多模態(tài)分析思路很可能受到bulk-seq多組學(xué)聯(lián)合分析的啟發(fā)(Meng, C. et al., 2016),Argelaguet開(kāi)發(fā)了一種名為MOFA( multi- omics factor analysis)的方法,該方法在多組學(xué)bulk-seq數(shù)據(jù)中效果良好,同時(shí)測(cè)試了單細(xì)胞DNA甲基化數(shù)據(jù)與RNA數(shù)據(jù)聯(lián)合處理情況,效果也可以。這暗示適用于bulk-seq的多組學(xué)數(shù)據(jù)處理方式可能也適用于單細(xì)胞多模態(tài)數(shù)據(jù)。鑒于單細(xì)胞數(shù)據(jù)規(guī)模遠(yuǎn)超bulk-seq,多視圖機(jī)器學(xué)習(xí)不失為一種重要的補(bǔ)充手段(Colomé- Tatché, M. & Theis, F. J., 2018)。
單細(xì)胞多模態(tài)研究策略為解析細(xì)胞內(nèi)不同組分間的關(guān)系提供了新方法。如CITE-seq和REAP-seq可以輕易鑒別出相關(guān)度較低的RNA-protein模塊,表明此處存在活躍的轉(zhuǎn)錄后調(diào)節(jié)。還有一個(gè)很有意思的是通過(guò)測(cè)量剪接過(guò)的成熟RNA與未剪接RNA的相對(duì)豐度,可以建立RNA與蛋白的關(guān)聯(lián)動(dòng)態(tài)模型(La Manno, G. et al., 2018)。
此外,還可以在不同類(lèi)型數(shù)據(jù)間建立統(tǒng)計(jì)模型。前面提到的sci-CAR文章建立了染色質(zhì)可及性與基因表達(dá)水平間的統(tǒng)計(jì)模型,通過(guò)染色質(zhì)可及性數(shù)據(jù)估計(jì)細(xì)胞內(nèi)基因表達(dá)水平(Cao, J. et al., 2018),另一組研究人員建立了gRNA與基因表達(dá)水平間的線(xiàn)性回歸模型,用以識(shí)別細(xì)胞應(yīng)答的前后關(guān)系,重構(gòu)轉(zhuǎn)錄網(wǎng)絡(luò)(Perturb-Seq(Dixit, A. et al., 2016))。通過(guò)這種手段可以研究目標(biāo)物種復(fù)雜的調(diào)控網(wǎng)絡(luò)。


不同來(lái)源測(cè)序數(shù)據(jù)整合

前面主要講了在同一測(cè)序?qū)嶒?yàn)同一批細(xì)胞進(jìn)行的多模態(tài)數(shù)據(jù)整合,而不同測(cè)序?qū)嶒?yàn)數(shù)據(jù)整合分析才是亟需解決的關(guān)鍵問(wèn)題。同bulk seq 數(shù)據(jù)一樣,處理批次效應(yīng)是綜合分析不同實(shí)驗(yàn)室、不同workflow產(chǎn)出數(shù)據(jù)的首要問(wèn)題(SVA包(Leek, J. T. 2014))。然而目前bulk seq水平的處理方法無(wú)法處理單細(xì)胞數(shù)據(jù)((Haghverdi, L, et al.,  2018,作者用MNN處理數(shù)據(jù),該法在mnnpy中得到改進(jìn));  Butler, A, et al,. 2018)。目前最新方法利用CCA/MNN可以識(shí)別出兩個(gè)數(shù)據(jù)集間共有的部分,判定細(xì)胞間共有的生物學(xué)狀態(tài),然后以這些相同狀態(tài)的細(xì)胞為基準(zhǔn)消除批次效應(yīng)。

2.1
常規(guī)scRNA-seq數(shù)據(jù)整合分析

此處作者介紹了他自己在Seurat V2中開(kāi)發(fā)的方法(Satija, R, et al., 2015;),該法用CCA鑒別出不同數(shù)據(jù)集間相同的細(xì)胞類(lèi)型且可以避免出現(xiàn)由批次效應(yīng)或常規(guī)PCA造成的假陽(yáng)性細(xì)胞類(lèi)型;接下來(lái)采用動(dòng)態(tài)時(shí)間規(guī)整算法校正數(shù)據(jù)集間細(xì)胞密度差異。這兩步驟可以將細(xì)胞投影到一個(gè)低維空間,具有相同生物學(xué)狀態(tài)的細(xì)胞相互接近且消除了不同數(shù)據(jù)集帶來(lái)的影響。

另一種方法即mnnCorrect,最早用于計(jì)算機(jī)領(lǐng)域圖形識(shí)別。該法尋找不同數(shù)據(jù)集間最接近的細(xì)胞,將之判定為潛在的狀態(tài)相同細(xì)胞,隨后利用成對(duì)MNNs距離計(jì)算一個(gè)批次參數(shù)(batch vector),用以校正原始表達(dá)矩陣(Haghverdi, L., 2018)。

CCA/mnnCorrect在整合處理不同來(lái)源的scRNA-seq數(shù)據(jù)時(shí)表現(xiàn)良好。這將極大提升發(fā)現(xiàn)稀有細(xì)胞、微弱轉(zhuǎn)錄差異細(xì)胞及與之對(duì)應(yīng)maker的能力(Haghverdi, L, et al,.2018Butler, A,et al,. 2018) 。這為建立一個(gè)統(tǒng)一的單細(xì)胞參考數(shù)據(jù)集提供了依據(jù)。在此基礎(chǔ)上,scRNA-seq數(shù)據(jù)整合分析得到了快速發(fā)展(Hie, B. L, et al., 2018; Barkas, N. et al., 2018; Park, J.-E., 2018; Korsunsky, I. et al., 2018; Stuart, T. et al., 2018; Welch, J. et al., 2018)。這種多數(shù)據(jù)集整合分析的應(yīng)用遠(yuǎn)不止用于校正批次效應(yīng)這么單一。它可以在單細(xì)胞尺度上深入比較細(xì)胞間的狀態(tài),發(fā)現(xiàn)細(xì)胞對(duì)環(huán)境及基因擾動(dòng)的特異性響應(yīng),對(duì)不同疾病及不同治療下的患者的測(cè)序數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。
scRNA-seq數(shù)據(jù)整合分析還可以擴(kuò)展至跨物種分析。Karaiskos,N比較了兩種果蠅早期胚胎的空間基因表達(dá)模式,通過(guò)構(gòu)建空間基因表達(dá)圖譜,該研究系統(tǒng)比較了兩個(gè)果蠅的同源基因表達(dá)譜,鑒定出了彼此間的進(jìn)化波動(dòng)。Tosches比較了爬行動(dòng)物與哺乳動(dòng)物腦細(xì)胞間的相關(guān)性。Baron分析了人與小鼠胰島細(xì)胞scRNA-seq數(shù)據(jù),鑒定出了二者間的保守亞群。Alpert開(kāi)發(fā)出了cellAlign,在一維水平上比對(duì)了人與小鼠的擬時(shí)軌跡,發(fā)現(xiàn)人胚胎合子激活要比小鼠晚,小鼠中比人活躍的基因皆與蛋白合成相關(guān)。跨物種分析未來(lái)是光明的,但對(duì)于多物種整合分析而言,精確鑒定物種間同源基因是多物種整合分析至關(guān)重要的一步。

2.2
多重scRNA-seq數(shù)據(jù)集間的細(xì)胞分類(lèi)

以細(xì)胞分類(lèi)信息的形式串聯(lián)不同的scRNA-seq數(shù)據(jù)集,或者借鑒到自己實(shí)驗(yàn)中,是優(yōu)于合并數(shù)據(jù)集然后de novo聚類(lèi)這種方法的。且隨著有參細(xì)胞圖譜的開(kāi)發(fā),這種方式將更加尋常。目前已開(kāi)發(fā)對(duì)應(yīng)方法:scmap- cell & scmap- cluster,其中scmap-cell 用乘積量化(product quantization)算法進(jìn)行比對(duì),而scmap-cluster則用于識(shí)別未知數(shù)據(jù)集中的cluster。

利用已有的注釋數(shù)據(jù)集,目前開(kāi)發(fā)的新方法采用奇異值分解、線(xiàn)性判別分析支持向量機(jī)算法來(lái)對(duì)細(xì)胞進(jìn)行分類(lèi)。此外,隨著引用數(shù)據(jù)集的大小、范圍與深度越來(lái)越高,監(jiān)督聚類(lèi)在解析細(xì)胞類(lèi)型方面要比無(wú)監(jiān)督聚類(lèi)強(qiáng)得多。通過(guò)以上這些方法,可以更精確地識(shí)別并解析細(xì)胞亞群。

2.3
不同來(lái)源和類(lèi)型的單細(xì)胞數(shù)據(jù)整合分析

satija已有相關(guān)文章研究:Comprehensive Integration of Single-Cell Data
這一部分講的是將scRNA-seq數(shù)據(jù)與其它不同來(lái)源和類(lèi)型數(shù)據(jù)諸如甲基化、染色質(zhì)結(jié)構(gòu)等整合分析的方法。


將scRNA-seq數(shù)據(jù)與其它類(lèi)型、不同來(lái)源的單細(xì)胞數(shù)據(jù)整合分析是無(wú)法提取到數(shù)據(jù)間的共同特征的,因?yàn)樗鼈儾皇且粋€(gè)類(lèi)型的數(shù)據(jù),需要不同的分析方法。這點(diǎn)在基于基因組的數(shù)據(jù)(如染色質(zhì)可及性與甲基化數(shù)據(jù))與基于基因的數(shù)據(jù)(如基因與蛋白表達(dá)數(shù)據(jù))間整合分析尤為明顯。但如果這些數(shù)據(jù)來(lái)自于同一類(lèi)細(xì)胞群,由于存在著共同的生物學(xué)狀態(tài),此時(shí)可以聯(lián)立分析以發(fā)現(xiàn)不同數(shù)據(jù)集類(lèi)型間的對(duì)應(yīng)關(guān)系。

MATCHER是一種在一維水平上比較不同類(lèi)型測(cè)序數(shù)據(jù)擬時(shí)軌跡的方法。簡(jiǎn)單來(lái)說(shuō)就是比對(duì)不同類(lèi)型測(cè)序數(shù)據(jù)的擬時(shí)軌跡,以確定這些數(shù)據(jù)集間的對(duì)應(yīng)關(guān)系。這種方法可以識(shí)別不同數(shù)據(jù)集間的“等效細(xì)胞”而不需預(yù)先知道彼此間的對(duì)應(yīng)關(guān)系。開(kāi)發(fā)者用scM&T- seq(Angermueller, C. et al., 2016)和scRNA-seq數(shù)據(jù)做了驗(yàn)證,準(zhǔn)確預(yù)測(cè)了DNA甲基化與基因表達(dá)之間的關(guān)系。


其他sc-seq數(shù)據(jù)不同于scRNA-seq數(shù)據(jù)一樣可以借助Marker解析細(xì)胞類(lèi)型,因此可以利用scRNA-seq解析出的細(xì)胞信息為其他sc-seq數(shù)據(jù)分析做參考。有研究(
Lake, B. B. et al., 2018)對(duì)不同腦組織切片進(jìn)行了單核RNAseq(snRNA-seq)與單細(xì)胞轉(zhuǎn)座子超敏性位點(diǎn)測(cè)序(scTHS-seq),通過(guò)梯度推進(jìn)算法利用單細(xì)胞基因表達(dá)譜指導(dǎo)了染色質(zhì)可及性測(cè)序數(shù)據(jù)集的細(xì)胞分類(lèi):作者首先鑒別出snRNA-seq數(shù)據(jù)集與scTHS-seq數(shù)據(jù)集共有的細(xì)胞亞群,訓(xùn)練一個(gè)可以將基因表達(dá)與染色質(zhì)可及性數(shù)據(jù)關(guān)聯(lián)的模型;然后利用該模型去分類(lèi)scTHS-seq中剩余未被分類(lèi)的細(xì)胞。這種方法可以更細(xì)致地對(duì)大腦組織中的細(xì)胞進(jìn)行分類(lèi)。同樣,可以整合scATAC-seq數(shù)據(jù)集來(lái)分析單細(xì)胞DNA甲基化或轉(zhuǎn)座酶染色質(zhì)可及性間的細(xì)胞分類(lèi)。


目前正在開(kāi)發(fā)的新方法有利用假定等價(jià)特征、或識(shí)別在所有類(lèi)型數(shù)據(jù)中的假定相關(guān)共享特征來(lái)進(jìn)行數(shù)據(jù)交叉模態(tài)分類(lèi)。
Welch開(kāi)發(fā)了一種集成非負(fù)矩陣分解(iNMF)的方法,名為L(zhǎng)IGER,可以跨模態(tài)整合數(shù)據(jù)。他們對(duì)同一類(lèi)型皮質(zhì)細(xì)胞分別進(jìn)行了亞硫酸鹽測(cè)序(snmC- seq)與scRNA-seq并對(duì)其進(jìn)行了分類(lèi)。他們假設(shè)基因體甲基化與其表達(dá)水平負(fù)相關(guān)從而整合了不同模態(tài)測(cè)序數(shù)據(jù)進(jìn)行細(xì)胞分類(lèi)。在seurat v3.0中,作者也引入了假定等價(jià)特征或關(guān)聯(lián)特征進(jìn)行多模態(tài)整合數(shù)據(jù)細(xì)胞分類(lèi)的方法。這些方法優(yōu)點(diǎn)如上所述,即可以利用scRNA-seq的細(xì)胞分類(lèi)信息來(lái)指導(dǎo)scATAC-seq數(shù)據(jù)細(xì)胞分類(lèi),鑒別出染色質(zhì)可及性與DNA甲基化的細(xì)胞特異模塊。

2.4
空間數(shù)據(jù)與測(cè)序數(shù)據(jù)整合

組織中細(xì)胞的空間結(jié)構(gòu)常反映出細(xì)胞間的功能差異與細(xì)胞命運(yùn)和譜系的差異。不同基因表達(dá)引導(dǎo)細(xì)胞向不同方向分化,不同細(xì)胞精確排列形成不同組織。關(guān)鍵是單細(xì)胞實(shí)驗(yàn)通常在分析前細(xì)胞已被解離,組織原位信息無(wú)法保留,scRNA-seq得到的表達(dá)譜不能完全反應(yīng)細(xì)胞空間信息。具有相似基因表達(dá)譜的細(xì)胞可能存在于不同的空間位置中,故而細(xì)胞分離過(guò)程中空間信息的缺失是很多單細(xì)胞實(shí)驗(yàn)的主要缺點(diǎn)。結(jié)合高分辨率基因表達(dá)譜與空間表達(dá)圖譜 (spatial expression maps) 將細(xì)胞空間坐標(biāo)與基因表達(dá)譜聯(lián)系起來(lái),可以解決這一問(wèn)題。有兩類(lèi)方法:計(jì)算模型或者RNA原位定量,可以同時(shí)收集到細(xì)胞空間坐標(biāo)與基因表達(dá)值。


FISH方法是原位基因檢驗(yàn)的金標(biāo)準(zhǔn),但是它檢測(cè)基因數(shù)目較少。新方法將探針與糾錯(cuò)碼相結(jié)合,可以一次性檢測(cè)到數(shù)百個(gè)基因表達(dá)情況,或使用空間條形碼來(lái)記錄mRNA逆轉(zhuǎn)錄過(guò)程中的空間信息。這些數(shù)據(jù)集可以通過(guò)計(jì)算方法進(jìn)行整合,同時(shí)獲取高通量的空間信息與基因表達(dá)信息。


目前計(jì)算整合FISH與scRNA-seq數(shù)據(jù)已有相關(guān)文章報(bào)道。這個(gè)思路最初由
SatijaAchim提出,應(yīng)用于腦組織研究中,后來(lái)擴(kuò)展到其他組織研究中,為個(gè)體本身提供了完整的空間表達(dá)圖譜。該類(lèi)研究通常關(guān)注關(guān)鍵基因的空間分布,獲取它們的空間表達(dá)模式,并為單個(gè)基因建立對(duì)應(yīng)表達(dá)模型,利用這些空間表達(dá)模型,將單細(xì)胞數(shù)據(jù)mapping到空間信息中。藉由該方法得到的整合數(shù)據(jù)集,可以研究幾乎所有基因的空間輪廓,進(jìn)而研究每種細(xì)胞所在區(qū)域情況。


目前最新的方法可以從該類(lèi)整合數(shù)據(jù)中系統(tǒng)分析基因空間表達(dá)趨勢(shì)。但是該類(lèi)方法只適用于已有明晰空間結(jié)構(gòu)的組織或個(gè)體,如早期胚胎與動(dòng)物肝臟;在成熟個(gè)體或?qū)嶓w腫瘤應(yīng)用仍不現(xiàn)實(shí)。一些研究提出了一種粗整合方案:scRNA-seq鑒定細(xì)胞簇marker基因后,用FISH或免疫組化檢測(cè)一小部分感興趣基因,將之與scRNA-seq相整合。但是此類(lèi)研究較為粗糙,并未提供系統(tǒng)的解決方案 (Puram, S. V. et al., 2017;Pandey, S. et al., 2018)。


近年來(lái),有兩種高分辨率的空間基因表達(dá)測(cè)定方法被開(kāi)發(fā)出來(lái),可以檢測(cè)大范圍2D或3D組織內(nèi)單個(gè)細(xì)胞數(shù)十至數(shù)百基因表達(dá)情況(
Wang, X. et al., 2018;Codeluppi, S. et al., 2018)。這些方法極大降低了組織背景熒光,提高了信噪比。這兩種方法(osmFISH&STARmap)均可以保有組織原位三維空間信息。這些方法可以原位獲取許多細(xì)胞和基因的精確表達(dá)譜,可以在細(xì)胞原位進(jìn)行分子分型,評(píng)估細(xì)胞分布環(huán)境,推斷細(xì)胞各類(lèi)細(xì)胞的三維分布,將細(xì)胞信息推到解剖學(xué)水平上去??臻g數(shù)據(jù)與scRNA-seq數(shù)據(jù)整合,可以為研究組織構(gòu)成與功能提供全新的手段。


展望

隨著單細(xì)胞技術(shù)日趨成熟,每個(gè)細(xì)胞所檢測(cè)的測(cè)量量與檢測(cè)到的細(xì)胞和分子數(shù)量都在逐漸增加。因此整合不同實(shí)驗(yàn)得到的不同模態(tài)數(shù)據(jù)成為必然。目前正在進(jìn)行的人類(lèi)細(xì)胞圖譜和關(guān)鍵模式生物圖譜是當(dāng)下最大規(guī)模的多模態(tài)數(shù)據(jù)整合工作。整合單細(xì)胞一系列多模態(tài)數(shù)據(jù),我們可以獲取轉(zhuǎn)錄組之上的細(xì)胞圖譜,洞悉細(xì)胞的整體狀態(tài)。分析單細(xì)胞多模態(tài)數(shù)據(jù)之間的關(guān)系,可以揭示細(xì)胞功能的潛在基礎(chǔ),推斷各模態(tài)間的因果關(guān)系。

生物學(xué)中有一個(gè)主要問(wèn)題:什么是細(xì)胞類(lèi)型?

解決方案正如那個(gè) 老問(wèn)題:“什么是基因?” 的答案一般,該問(wèn)題是通過(guò)跨物種DNA序列比較與多種模式下的生化分析來(lái)解答的。故而本問(wèn)題的答案必是在多種模式與條件下,對(duì)單細(xì)胞進(jìn)行細(xì)致分析來(lái)回答。

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多

    99一级特黄色性生活片| 久久99一本色道亚洲精品| 久久热九九这里只有精品| 可以在线看的欧美黄片| 欧美三级大黄片免费看| 亚洲天堂精品在线视频| 丰满少妇被猛烈撞击在线视频| 国产级别精品一区二区视频| 黑色丝袜脚足国产一区二区| 日本免费一区二区三女| 日韩18一区二区三区| 欧美色婷婷综合狠狠爱| 国产精品一区二区传媒蜜臀| 日本视频在线观看不卡| 日韩高清毛片免费观看| 男人的天堂的视频东京热| 亚洲天堂国产精品久久精品| 欧洲自拍偷拍一区二区| 国产一区日韩二区欧美| 国产精品不卡免费视频| 麻豆看片麻豆免费视频| 色鬼综合久久鬼色88| 男女一进一出午夜视频| 精品亚洲av一区二区三区| 成人日韩在线播放视频| 国产亚洲神马午夜福利| 国产主播精品福利午夜二区| 精品综合欧美一区二区三区| 亚洲一区二区福利在线| 国产精品夜色一区二区三区不卡| 亚洲国产精品肉丝袜久久| 日韩人妻一区中文字幕| 日韩精品一区二区不卡| 国产熟女一区二区三区四区| 色婷婷视频在线精品免费观看| 国产伦精品一一区二区三区高清版| 国产对白老熟女正在播放| 国内精品偷拍视频久久| 亚洲一区二区三区三区| 中文字幕精品一区二区三| 91日韩欧美国产视频|