單細(xì)胞轉(zhuǎn)錄組交流群有小伙伴鞭尸了這樣的一個(gè)單細(xì)胞文章,標(biāo)題是:《Single-cell multiomics revealed the dynamics of antigen presentation, immune response and T cell activation in the COVID-19 positive and recovered individuals》,我看了看,是 December 2022 發(fā)表,并不算是很老的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)集??梢钥吹皆撐墨I(xiàn)的數(shù)據(jù)集鏈接是:https://www.ncbi.nlm./geo/query/acc.cgi?acc=GSE201088
是 人的PBMC樣品,Healthy (n = 4), COVID-19 (n = 16) and recovered (n = 13) ,這個(gè)單細(xì)胞轉(zhuǎn)錄組技術(shù)起初看起來(lái)是很高級(jí) ,是BD single cell multiplexing kit (Human) ,包括:
a pool of 40 oligo-attached antibody for surface markers (Ab-Seq). A poly-A transcripts library (WTA), Ab-Seq library and library from oligos of Sampe multiplexing kit (SMK) 然后,我看了看文章里面的降維聚類分群結(jié)果, 真的是一言難盡?。?/strong>
一言難盡的UMAP圖 圖例很清楚,是 (B) UMAP visualization of the 124726 cells across the healthy, active COVID-19 and the recovered individuals.
但是如果你僅僅是從它文章里面的描述來(lái)看,又不能保證它文章數(shù)據(jù)處理是否有錯(cuò)誤??!
文章數(shù)據(jù)處理是否有錯(cuò)誤? 我去該文獻(xiàn)的數(shù)據(jù)集鏈接里面找到了它的表達(dá)量矩陣文件,很有意思的是需要去了解一下BD單細(xì)胞轉(zhuǎn)錄組技術(shù)的表達(dá)量矩陣情況:
17M Apr 20 2022 GSM6050537_Combined_B1_RSEC_MolsPerCell.csv.gz 5.5M Apr 20 2022 GSM6050538_Combined_B2_RSEC_MolsPerCell.csv.gz 17M Apr 20 2022 GSM6050539_Combined_B3_RSEC_MolsPerCell.csv.gz 1.3M Apr 20 2022 GSM6050540_Combined_B4_RSEC_MolsPerCell.csv.gz 2.6M Apr 20 2022 GSM6050541_Combined_B5_RSEC_MolsPerCell.csv.gz 15M Apr 20 2022 GSM6050542_Combined_B6_RSEC_MolsPerCell.csv.gz 40M Apr 20 2022 GSM6050543_Combined_B7_RSEC_MolsPerCell.csv.gz
如果你讀取任意一個(gè)文件,就可以看到里面首先是有a pool of 40 oligo-attached antibody for surface markers (Ab-Seq).的表達(dá)量矩陣:
image-20231001004536888 然后還有兩萬(wàn)多個(gè)基因的表達(dá)量矩陣,理論上這兩個(gè)矩陣應(yīng)該是獨(dú)立各自的下游降維聚類分群哈。
學(xué)徒作業(yè) 上面的BD單細(xì)胞轉(zhuǎn)錄組應(yīng)該是首先要區(qū)分Ab-Seq和WTA兩個(gè)矩陣,各種獨(dú)立降維聚類分群分析,大家試試看!
Smart-seq2和10x這兩個(gè)單細(xì)胞技術(shù)是現(xiàn)在初學(xué)者進(jìn)入單細(xì)胞領(lǐng)域最需要掌握的,它們代表著單細(xì)胞的兩個(gè)全然不同的發(fā)展策略。絕大部分的技術(shù)原理介紹會(huì)從 單細(xì)胞懸浮液制備到測(cè)序細(xì)節(jié)面面俱到,其實(shí)并不那么的初學(xué)者友好。這里給推薦一個(gè)高度精煉的綜述,這個(gè)綜述于2020年9月發(fā)表在 《Experimental & Molecular Medicine》雜志,標(biāo)題是:《Single-cell sequencing techniques from individual to multiomics analyses》,鏈接是:https://www./articles/s12276-020-00499-2
smart-seq2技術(shù)依賴于C1這個(gè)儀器,每次都是96個(gè)細(xì)胞一起測(cè)序,每個(gè)細(xì)胞的測(cè)序量這個(gè)綜述可能是寫錯(cuò)了,應(yīng)該是1M-10M為佳,不太可能是100-1000個(gè)M,最重要的是它是整個(gè)RNA分子的全長(zhǎng)測(cè)序,每個(gè)細(xì)胞都是獨(dú)立的測(cè)序。 但是10X呢,每次可以測(cè)好幾千的細(xì)胞,每個(gè)細(xì)胞只需要5-10K的reads,而且僅僅是測(cè)RNA分子的一段即可,全部的細(xì)胞都混合在一起,雖然說(shuō)有barcode可以區(qū)分。 文末友情宣傳 強(qiáng)烈建議你推薦給身邊的博士后以及年輕生物學(xué)PI ,多一點(diǎn)數(shù)據(jù)認(rèn)知,讓他們的科研上一個(gè)臺(tái)階: