單細(xì)胞測序做為近十年最偉大的科學(xué)技術(shù)之一,它的應(yīng)用在很多科研領(lǐng)域均產(chǎn)生了深刻的影響。單細(xì)胞測序技術(shù)解決了很多在bulk測序上解決不了的單個細(xì)胞尺度上的機制研究,這使其已經(jīng)成為一種現(xiàn)象級研究手段。做為一種適應(yīng)性很廣,功能多樣的測序技術(shù),它在研究腫瘤抑制性,免疫細(xì)胞和神經(jīng)系統(tǒng)復(fù)雜性上有突出的優(yōu)勢。除了迅速增長的單細(xì)胞測序數(shù)據(jù)之外,各種基于單細(xì)胞測序的生信分析工具也得以快速發(fā)展。雖然單細(xì)胞測序技術(shù)最常用于腫瘤研究,而近些年在非腫瘤領(lǐng)域也在迅速增長,考慮到大家也有關(guān)注非腫瘤研究領(lǐng)域,并且腫瘤研究的單細(xì)胞數(shù)據(jù)庫也都被介紹的很多。所以小編系統(tǒng)整理了截止到2022年初所有的非腫瘤單細(xì)胞數(shù)據(jù)庫,今天隨推文一起分享給大家,此外我們還整理了具體疾病的單細(xì)胞數(shù)據(jù)集,有需要的文章最下方歡迎掃碼領(lǐng)取。 以下對非腫瘤單細(xì)胞數(shù)據(jù)庫的介紹主要分為三種類型:第一種是大型綜合單細(xì)胞數(shù)據(jù)庫,這種數(shù)據(jù)庫多是多項重大研究成果的產(chǎn)物,其主要是作為單細(xì)胞數(shù)據(jù)儲存的數(shù)據(jù)庫;第二種是疾病特異性單細(xì)胞數(shù)據(jù)庫,這種非腫瘤單細(xì)胞數(shù)據(jù)庫收錄的數(shù)據(jù)就沒有第一種多,主要是針對具體的疾病類型進行數(shù)據(jù)整理;第三種是單細(xì)胞功能分析數(shù)據(jù)庫,這種數(shù)據(jù)庫是針對某一項科學(xué)問題,對單細(xì)胞數(shù)據(jù)進行功能分析的數(shù)據(jù)庫,我們可以使用這種數(shù)據(jù)庫完成對單細(xì)胞數(shù)據(jù)的某項具體的功能分析。 一.大型綜合單細(xì)胞數(shù)據(jù)庫1.Human cell atlas(HCA):人類細(xì)胞圖譜計劃,迄今為止項目最龐大的單細(xì)胞測序項目成果。聚焦人正常組織,獲取人體各個組織器官的單細(xì)胞層面數(shù)據(jù)均可使用這個網(wǎng)站進行下載。2.SCXA:EBI旗下的單細(xì)胞數(shù)據(jù)庫,收錄了各種疾病類型的單細(xì)胞數(shù)據(jù),而且這個網(wǎng)站持續(xù)更新。由于EBI旗下還有很多bulk RNA數(shù)據(jù)庫和功能分析數(shù)據(jù)庫,這個網(wǎng)站均可無縫連接到相應(yīng)數(shù)據(jù)庫。 3.Single Cell Portal:目前收錄412個研究中的1800萬 的單細(xì)胞數(shù)據(jù)庫,而且持續(xù)更新,數(shù)據(jù)維護的很好,還可以進行簡單的在線分析。https://singlecell./single_cell4.SCPortalen:日本的單細(xì)胞測序數(shù)據(jù)庫,日本的生物醫(yī)學(xué)領(lǐng)域還是很先進的,很多諾貝爾醫(yī)學(xué)獎得主都是日本人。這個網(wǎng)站做的很精細(xì),唯一的缺點是數(shù)據(jù)更新沒有Single Cell Portal和SCXA這兩個數(shù)據(jù)庫快。http://single-cell.clst./5.scRNASeqDB:另一大型單細(xì)胞數(shù)據(jù)庫,專門收集人類單細(xì)胞測序的數(shù)據(jù)庫,涵蓋200種細(xì)胞系和13440個GSM。除了數(shù)據(jù)龐大的特點,這個數(shù)據(jù)庫可以進行關(guān)鍵基因的在線分析。https://bioinfo./scrnaseqdb/6.Tabula Muris:小鼠的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)庫,包含了來自20個器官和組織的近10萬個細(xì)胞。這些數(shù)據(jù)允許對組織間共享的細(xì)胞類型的基因表達進行直接和受控的比較,例如來自不同解剖位置的免疫細(xì)胞。它們還允許對兩種不同的技術(shù)的單細(xì)胞數(shù)據(jù)進行比較:基于微流控液滴的3端測序:以相對較低的覆蓋率對每個器官的數(shù)千個細(xì)胞進行研究;和基于流式細(xì)胞儀的全長轉(zhuǎn)錄本分析:提供更高的靈敏度和覆蓋率。https://tabula-muris.ds./7.SpatialDB:專門存放單細(xì)胞空間轉(zhuǎn)錄組數(shù)據(jù)的數(shù)據(jù)庫,單細(xì)胞空間轉(zhuǎn)錄組相對于普通的單細(xì)胞測序數(shù)據(jù),其保留了樣本的各種細(xì)胞空間分布信息。這個數(shù)據(jù)庫可以下載多種疾病模型的單細(xì)胞空間轉(zhuǎn)錄組的數(shù)據(jù)。8.MCA:浙大郭國驥老師團隊制作的小鼠單細(xì)胞圖譜數(shù)據(jù)庫,小鼠正常組織的單細(xì)胞數(shù)據(jù)均可在這個數(shù)據(jù)庫中下載。9.PlantscRNAd:光有動物的單細(xì)胞數(shù)據(jù)可不夠,還有做植物研究的小伙伴。但是我們知道植物細(xì)胞有細(xì)胞壁,做植物的單細(xì)胞測序難度是很高的,于是業(yè)界大佬浙江大學(xué)樊龍江團隊就專門構(gòu)建了植物單細(xì)胞數(shù)據(jù)庫。http://ibi./plantscrnadb/
二.疾病特異性單細(xì)胞數(shù)據(jù)庫1. SC2disease:此數(shù)據(jù)庫主要用于各類疾病分析,其基于各種疾病和正常單細(xì)胞轉(zhuǎn)錄組基因表達譜數(shù)據(jù),為研究者提供豐富的細(xì)胞特異性信息,如感興趣基因細(xì)胞特異性表達情況,特定細(xì)胞類型標(biāo)記,多種疾病生物標(biāo)志物,以及提供在疾病和非疾病狀態(tài)下各種類型細(xì)胞的表達譜差異性分析功能。2.BloodSpot:健康和血液病單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)庫,對于研究血液性疾病的小伙伴,這是一個寶貴的數(shù)據(jù)庫。這個數(shù)據(jù)庫雖然只收錄了循環(huán)系統(tǒng)的單細(xì)胞數(shù)據(jù),但是功能強大,可使用這個數(shù)據(jù)庫進行多種在線分析,而且可以將分析結(jié)果以各種圖片的形式導(dǎo)出。http://servers.binf./bloodspot/3. KIT:腎臟單細(xì)胞數(shù)據(jù)庫,收錄了各種腎臟組織的單細(xì)胞數(shù)據(jù),對腎臟疾病進行研究的小伙伴可要將這個網(wǎng)址記住。 4. VascularSingleCell:血管單細(xì)胞數(shù)據(jù)庫,這個數(shù)據(jù)庫收錄了人和小鼠的腦血管肺血管的單細(xì)胞數(shù)據(jù),不同于上面講述的血細(xì)胞數(shù)據(jù)庫,這個數(shù)據(jù)庫只關(guān)注血管細(xì)胞。http:///VascularSingleCells/database.html5. iSyTE:專注于研究眼睛發(fā)育的單細(xì)胞數(shù)據(jù)庫。https://research.bioinformatics./iSyTE/ppi/index.php6.DBTMEE:專門用于研究眼睛小鼠早期胚胎發(fā)育的單細(xì)胞數(shù)據(jù)庫。7.CeDR Atlas:CeDR Atlas數(shù)據(jù)庫基于文獻中人類、小鼠和不同細(xì)胞系的特異性藥物反應(yīng)信息,綜合分析了細(xì)胞類型特異性藥物反應(yīng)分析,涵蓋疾病狀態(tài)下的細(xì)胞類型和正常細(xì)胞類型,為細(xì)胞藥物反應(yīng)譜提供直接參考。數(shù)據(jù)庫目前收錄超過582個人類、小鼠和細(xì)胞系的單細(xì)胞數(shù)據(jù)結(jié)果,包括約140個表型和1250個組織/細(xì)胞類型的約188,157個人類相關(guān)、42660個小鼠相關(guān)和10299個細(xì)胞系相關(guān)的細(xì)胞藥物反應(yīng)信息。8.Jingle Bells:數(shù)據(jù)來源為公開可用的數(shù)據(jù)(該數(shù)據(jù)庫只是把公開數(shù)據(jù)進行了整合) 數(shù)據(jù)來源相對集中,收集免疫(120個數(shù)據(jù)集)以及非免疫(183個數(shù)據(jù)集)該數(shù)據(jù)庫作為免疫相關(guān)數(shù)據(jù)的數(shù)據(jù)庫確實具有著把相關(guān)信息集中以便我們搜索和學(xué)習(xí)的作用,我們可以通過這個數(shù)據(jù)庫去了解免疫相關(guān)的數(shù)據(jù)以及文獻從而深化我們的課題進展9.Aging Atlas:衰老研究一直都是一個很熱門的領(lǐng)域,這個數(shù)據(jù)庫整理了多項專門研究衰老的單細(xì)胞數(shù)據(jù),可以使用其進行衰老相關(guān)基因的研究。https://ngdc./aging/index10.Gut Cell Atlas:腸道組織的單細(xì)胞測序數(shù)據(jù)庫,所有單細(xì)胞數(shù)據(jù)均公開可下載。11.StemMapper:干細(xì)胞發(fā)育研究單細(xì)胞數(shù)據(jù)庫。12.stemformatics:和StemMapper類似,同樣是針對干細(xì)胞構(gòu)建的單細(xì)胞數(shù)據(jù)庫。https://www./expressions/gene_expression_graph 三.單細(xì)胞功能分析數(shù)據(jù)庫1.HCL:不同于人類圖譜計劃,這個數(shù)據(jù)庫在線分析功能強大。由浙江大學(xué)郭國驥教授開發(fā),包括人類50種組織的超過70萬個細(xì)胞,劃分為102個cluster,可以查詢每種組織、每個cluster的marker基因??梢陨蟼骱拖螺d數(shù)據(jù)自行分析。2.Cell Blast:Cell BLAST是一個自帶高質(zhì)量參考數(shù)據(jù)庫的scRNA-seq數(shù)據(jù)檢索/注釋工具,能做細(xì)胞類型鑒定、發(fā)現(xiàn)新細(xì)胞類型、注釋連續(xù)細(xì)胞狀態(tài)。3. PanglaoDB:來自瑞典卡洛琳學(xué)院的研究人員開發(fā)的PanglaoDB數(shù)據(jù)庫,用于探索小鼠和人類scRNA-seq數(shù)據(jù),為單細(xì)胞組學(xué)研究提供公共scRNA-seq數(shù)據(jù)資源。相關(guān)研究成果2019年發(fā)表在《Database》。PanglaoDB數(shù)據(jù)庫收集并整合來自多個研究的數(shù)據(jù),包括:小鼠的184種組織、1063個樣本、446W細(xì)胞;人的74種組織、305個樣本、112w細(xì)胞。4.CellMarkrer:該數(shù)據(jù)庫包括來源于100000 已發(fā)表文獻整理出來的,人的158種組織/亞組織、467個細(xì)胞類型、13605個Marker基因;小鼠81種組織/亞組織、389個細(xì)胞類型、9148個Marker基因。用戶可以通過選擇物種、組織類型、細(xì)胞類型來查詢marker基因,也可以下載marker基因列表,還可以上傳自己的文章或數(shù)據(jù)。http://bio-bigdata./CellMarker/5.scQuery:對比分析不同研究的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)。6.SCDevDB:單細(xì)胞深度組學(xué)數(shù)據(jù)庫,在線分析功能強大。7.LnCeCell:從GEO和CancerSEA收集了與癌癥相關(guān)的scRNA-seq數(shù)據(jù)集,確保質(zhì)量,控制癌細(xì)胞數(shù)> 100,并且通過注釋將表達譜分為mRNA和lncRNA,使用GENCODE數(shù)據(jù)庫注釋(GRCh38,版本34)。最后得到源于25種癌癥的40個單細(xì)胞數(shù)據(jù)集,總共有94605個單細(xì)胞被用于構(gòu)建LnCeCell。8.ColorCells:這個數(shù)據(jù)庫提供了一個友好的可視化界面,包括PCA和t-SNE算法應(yīng)用于細(xì)胞集群在2d和3d空間中,開發(fā)一個工具來展示各種組織和細(xì)胞類型在人類和老鼠,建立一個超幾何分布的統(tǒng)計檢驗方法自動分配給細(xì)胞集群,基于SNN和pearson相關(guān)分析,構(gòu)建蛋白- lncrna共表達網(wǎng)絡(luò),從scRNA-Seq數(shù)據(jù)預(yù)測lncrna。9.Virtual Cytometry:它為使用scRNA-seq數(shù)據(jù)的免疫細(xì)胞分化研究提供計算平臺,通過“發(fā)現(xiàn)模塊”和“假設(shè)測試模塊”分別識別和驗證參與免疫細(xì)胞分化的基因。10.SPICA:專注于研究病毒感染和腫瘤小鼠模型的單細(xì)胞數(shù)據(jù)庫。11.GRNdb:轉(zhuǎn)錄因子及其下游靶基因形成的基因調(diào)控網(wǎng)絡(luò)(Gene Regulatory Network, GRN)數(shù)據(jù)庫,是一個免費訪問和用戶友好的數(shù)據(jù)庫,可以方便地探索和可視化由轉(zhuǎn)錄因子(轉(zhuǎn)錄因子)和下游靶基因(稱為調(diào)控)形成的預(yù)測調(diào)控網(wǎng)絡(luò),基于大規(guī)模RNA-seq數(shù)據(jù),以及已知的tf -靶標(biāo)關(guān)系,適用于各種人類和小鼠條件。 12.SciBet:是一種利用單細(xì)胞RNA測序技術(shù)預(yù)測任意隨機測序細(xì)胞身份的計算工具。與其他有監(jiān)督的單元類型識別方法相比,SciBet在精度、魯棒性、可擴展性和速度方面都具有優(yōu)勢。在普通計算機上,對于包含10萬個cell的數(shù)據(jù)集,我們可以在1秒左右完成準(zhǔn)確的特征選擇和分類分析。我們不僅提供了R語言的二進制包,還提供了來自多個數(shù)據(jù)集的大約100種訓(xùn)練過的模式。此外,用戶可以在線使用SciBet上傳他們的定制數(shù)據(jù)集進行分類。http://scibet./index.html13.CellPhoneDB:細(xì)胞間通訊網(wǎng)絡(luò)研究的必備研究工具,是由英國Wellcome Sanger Institute的Teichmann Lab和Vento-Tormo Lab開發(fā),但是在線工具不是很穩(wěn)定,需下載自行分析。14.scMetabolism:收集了KEGG,Reactom中的基因集,可自行上傳數(shù)據(jù),完成對單細(xì)胞數(shù)據(jù)完成代謝通路的分析。http://www./scMetabolism/15.signatureDB: B cell數(shù)據(jù)庫,相應(yīng)成果在2018年發(fā)表在新英格蘭雜志上,數(shù)據(jù)以表格的形式進行展示,僅供自行下載研究。https://lymphochip./signaturedb/小編可以負(fù)責(zé)任的和大家講,這是截止到目前,最全面的非腫瘤單細(xì)胞數(shù)據(jù)總結(jié)的推文了。其實還有一個數(shù)據(jù)庫沒有提及,那就是GEO數(shù)據(jù)庫,這個數(shù)據(jù)庫是很多上述講到的數(shù)據(jù)庫數(shù)據(jù)的最初來源,大家也都知道GEO涵蓋了包括bulk, ATAC, Chip等各種數(shù)據(jù),當(dāng)然各大單細(xì)胞研究的數(shù)據(jù)也會優(yōu)先上傳在這個數(shù)據(jù)庫上,小編在這里就不對其進行細(xì)說了。各種單細(xì)胞數(shù)據(jù)庫是非常寶貴的資源,對已經(jīng)發(fā)表的數(shù)據(jù)進行二次分析也逐漸成為一種常態(tài),特別對一些經(jīng)費不足的小課題組,分析已經(jīng)發(fā)表的單細(xì)胞數(shù)據(jù)來研究自己的科學(xué)問題是一項非常具有重大意義的工作。運用這些數(shù)據(jù)庫進行數(shù)據(jù)挖掘時,首先是去綜合性數(shù)據(jù)庫下載數(shù)據(jù),因為這些大型數(shù)據(jù)庫對數(shù)據(jù)的整理相對規(guī)范;其次針對自己的研究領(lǐng)域去找疾病特異性的單細(xì)胞數(shù)據(jù)庫;最后是利用可以進行在線分析的數(shù)據(jù)庫對具體細(xì)胞亞群的功能進行研究;最后,希望大家都能利用好這些非腫瘤數(shù)據(jù)庫資源,早早發(fā)表大paper.
|