一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

二代測(cè)序 | 數(shù)據(jù)如何上傳到SRA數(shù)據(jù)庫(kù)?

 醫(yī)學(xué)院的石頭 2018-01-28
我想不少小伙伴的實(shí)驗(yàn)都涉及到二代測(cè)序吧,燃鵝,沒錯(cuò),你的樣本是師兄師姐提的!你的測(cè)序是公司做的!你的數(shù)據(jù)分析是公司測(cè)序完花5分鐘順手分析的。就在你以為萬事具備只欠東風(fēng),文章發(fā)表指日可待之時(shí),只因在人群中多看了雜志的instructions for authors一眼,竟發(fā)現(xiàn)還有一個(gè)重要的問題:誰能幫我把數(shù)據(jù)上傳NCBI啊,我要accession number。

SRA是NCBI中專門用于提交測(cè)序結(jié)果中原始序列數(shù)據(jù)的數(shù)據(jù)庫(kù)。從測(cè)序始祖454到三代測(cè)序pacbio,鮮肉平臺(tái)nanopore的數(shù)據(jù)都可以提交到這個(gè)數(shù)據(jù)庫(kù)中。同時(shí),SRA還和(European Bioinformatics Institute)EBI,以及(DNA Database of Japan)DDBJ兩個(gè)數(shù)據(jù)庫(kù)共享數(shù)據(jù),即后兩個(gè)數(shù)據(jù)庫(kù)中上傳的數(shù)據(jù)也可以在SRA中檢索到。SRA數(shù)據(jù)庫(kù)的主要用途是實(shí)現(xiàn)測(cè)序數(shù)據(jù)的共享和再利用,挖個(gè)課題再做個(gè)meta什么的,不得不說SRA簡(jiǎn)直就是居家旅行開題畢業(yè)必備大寶藏。除了滿滿的數(shù)據(jù)信息等待有心人去挖掘之外,在數(shù)據(jù)庫(kù)主頁還有一些小工具可將數(shù)據(jù)庫(kù)下載的數(shù)據(jù)轉(zhuǎn)換成方便分析的格式。


目前,絕大多數(shù)雜志(至少IF>3以上的)在投稿須知中都會(huì)要求測(cè)序數(shù)據(jù)提交至公共數(shù)據(jù)庫(kù)并提供索引編碼。那今天我們就來手把手學(xué)習(xí)如何上傳二代測(cè)序數(shù)據(jù)到SRA(Sequence Read Archive)數(shù)據(jù)庫(kù)。想要上傳芯片數(shù)據(jù)的請(qǐng)上二樓左轉(zhuǎn)去GEO數(shù)據(jù)庫(kù)。很多小伙伴有疑問:原始數(shù)據(jù)是二代測(cè)序,但結(jié)果主要是在講表達(dá)差異,應(yīng)該上傳GEO還是SRA?雜志社一般規(guī)定,測(cè)序數(shù)據(jù)用于表達(dá)分析,兩個(gè)數(shù)據(jù)庫(kù)都是可以的。但我個(gè)人推薦方便操作的SRA。(當(dāng)然NCBI也是推薦測(cè)序數(shù)據(jù)上傳SRA,芯片數(shù)據(jù)上傳GEO的


1)注冊(cè)并登入NCBI賬號(hào),然后進(jìn)入NCBI submission portal,選擇SRA數(shù)據(jù)庫(kù)https://submit.ncbi.nlm.


2)在數(shù)據(jù)庫(kù)介紹頁面選擇文件上傳方式(這里我選用第一種使用插件上傳。這個(gè)是用戶界面形式的簡(jiǎn)單易用。用FTP的選下面command line)。


3)安裝完之后,返回?cái)?shù)據(jù)庫(kù)介紹頁面。點(diǎn)選創(chuàng)建新任務(wù)(這個(gè)頁面同時(shí)也有對(duì)上傳所需測(cè)序原始文件格式的要求和介紹。推薦格式是用來存儲(chǔ)序列比對(duì)后的.bam二進(jìn)制壓縮文件,但也支持FASTQ和SAM等文件格式


4)第一頁基本信息頁隨便填一填。右上SUB編碼是正在提交項(xiàng)目的臨時(shí)編碼,不用于提供給雜志作為數(shù)據(jù)庫(kù)索引。完成填寫后,點(diǎn)擊繼續(xù)。(在填寫過程中,所有信息都是可以修改的,在最終提交前還有檢查核對(duì)所填信息的步驟


5)第二頁項(xiàng)目信息頁。這個(gè)頁面中的BioProject和BioSamples信息也可以在步驟1)的頁面單獨(dú)創(chuàng)建并分別獲得PRJNA和SAMN開頭的兩個(gè)索引碼填在這里。這里我沒有單獨(dú)創(chuàng)建這部分信息。如果你的測(cè)序信息很重要或者文章還在準(zhǔn)備中不想立即公開數(shù)據(jù),可以在這個(gè)頁面預(yù)設(shè)一個(gè)日期發(fā)布數(shù)據(jù)(最長(zhǎng)預(yù)設(shè)時(shí)限為4年左右。也就是說你2017年提交的數(shù)據(jù),可以設(shè)置數(shù)據(jù)在2021年開放檢索)。


6)第三頁項(xiàng)目概況。如果你的項(xiàng)目不是NIH資助的(我估計(jì)肯定不是的),那這頁就填下面三項(xiàng)就差不多了。


7)第四頁樣本類型。就是點(diǎn)擊一下的事兒,大概半秒鐘。當(dāng)樣本為人類樣本時(shí),如果你的樣本在公開之前需要授權(quán)(當(dāng)然我從來沒聽說過誰的樣本是這樣的,這條兒基本上是用來無視的)請(qǐng)選擇dbGaP數(shù)據(jù)庫(kù)上傳。目測(cè)99.9%的人都上傳的SRA,但是上傳之前記得隱去數(shù)據(jù)中的病人個(gè)人信息部分,什么姓名,聯(lián)系電話這類的信息。


8)第五頁樣本詳情描述頁。下載模版excel照著填。 


下圖中7個(gè)綠色項(xiàng)為必填項(xiàng)不可留空,但是可以填數(shù)據(jù)未收集(沒錯(cuò),就是變相留空)。填完后保存為.txt格式上傳。詳情見圖。數(shù)據(jù)提交后,點(diǎn)擊繼續(xù),可能會(huì)出現(xiàn)報(bào)錯(cuò)信息,這是由于提供的信息不足以讓數(shù)據(jù)庫(kù)識(shí)別和區(qū)分樣本造成的。如果一類生物樣本有多個(gè)生物學(xué)重復(fù),可以加一列“replicates”分類項(xiàng)注明生物學(xué)重復(fù)。


9)第六頁測(cè)序詳情描述頁。在這一頁你需要填寫每一個(gè)測(cè)序文庫(kù)的信息,例如測(cè)序類別WGA, Amplicon, RNA-Seq, ChIP-Seq,或者測(cè)序儀型號(hào)等信息??梢赃x在線填寫,如圖


或者下載表格,填寫后上傳(和步驟8)類似)。表格帶有三張表單,第一頁和第三頁為說明頁可直接跳過。填寫第二頁紅框中13個(gè)必填項(xiàng),填好后選擇另存為.txt格式。將.txt文件上傳。


需要注意的是,步驟8)和9)填寫的兩張表格同名信息要一致。除此之外,上傳文件要注意帶擴(kuò)展名,否則會(huì)因?yàn)橄到y(tǒng)找不到上傳文件對(duì)應(yīng)的文件名而報(bào)錯(cuò)。最后一欄填寫比對(duì)參考序列名稱,可以在NCBI assembly 數(shù)據(jù)庫(kù)查詢https://www.ncbi.nlm./assembly/ .如果是靶向測(cè)序結(jié)果,比對(duì)序列不在數(shù)據(jù)庫(kù)中,可以在這欄填寫自己的序列文件名稱,隨后上傳 。

10)上傳測(cè)序數(shù)據(jù)文件(這里我上傳的是.bam文件)。雖然可以上傳完后自動(dòng)提交,但如果數(shù)據(jù)量不大的話建議手動(dòng)逐個(gè)上傳。親測(cè)批量上傳比較卡。


11)全部信息填寫完之后,在最終頁面確認(rèn)信息無誤后提交。等待數(shù)據(jù)庫(kù)審核。提交之后1-2分鐘會(huì)收到正確創(chuàng)建BioProject的郵件和PRJNA ID,5-10分鐘會(huì)收到正確創(chuàng)建BioSamples的郵件和SAMN ID。如果所有數(shù)據(jù)和信息都沒有問題,系統(tǒng)隊(duì)列處理完之后就會(huì)顯示提交成功(剛提交完顯示狀態(tài)為submitted/waiting processing。正常情況下12-24小時(shí)之內(nèi)系統(tǒng)就會(huì)反饋提交的文件是否有問題)。之后就可以在自己的submission portal頁面下載metadata查到accession number啦(metadata表下載打開在study一欄下面的SRP開頭的號(hào)碼就是啦


到這里為止,二代測(cè)序數(shù)據(jù)上傳NCBI數(shù)據(jù)庫(kù)的任務(wù)就完成了。拿到accession number,麻麻再也不用擔(dān)心我發(fā)不了文章了。


除此之外,如果想要查詢提交進(jìn)度或者追蹤提交錯(cuò)誤詳情的可以到SRA數(shù)據(jù)庫(kù)追蹤提交數(shù)據(jù)的詳細(xì)情況https://www.ncbi.nlm./sra 

華麗麗的分割線


李莫愁博士:二代測(cè)序現(xiàn)在的蚊帳中越來越常用到了,所以數(shù)據(jù)就需要更完整地上傳到SRA、ENA或者DRA的數(shù)據(jù)庫(kù)中,當(dāng)然SRA是現(xiàn)在最常用到的,但是上傳數(shù)據(jù)的話,卻并不是很方便。感謝紅燒卜卜星童鞋給我們的投稿,也希望對(duì)大家有所幫助。好了,今天就先策到這里吧。


    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多

    亚洲欧美日韩中文字幕二欧美| 国产午夜福利片在线观看| 国产日韩欧美国产欧美日韩| 亚洲一区二区精品久久av| 国产一区国产二区在线视频| 欧美一区二区三区播放| 东京热加勒比一区二区三区| 亚洲国产性感美女视频| 99久热只有精品视频最新| 日韩欧美一区二区黄色| 少妇视频一区二区三区| 精品国模一区二区三区欧美| 一区二区日本一区二区欧美| 亚洲国产成人av毛片国产| 国产老熟女乱子人伦视频| 国产精品日韩精品最新| 日韩丝袜诱惑一区二区| 免费观看日韩一级黄色大片| 高中女厕偷拍一区二区三区| 欧美一级特黄特色大色大片| 亚洲性生活一区二区三区| 欧美区一区二在线播放| 黄片免费在线观看日韩| 熟妇人妻av中文字幕老熟妇| 国产性情片一区二区三区| 97人妻精品免费一区二区| 色丁香一区二区黑人巨大| 国产午夜福利一区二区| 欧美黑人黄色一区二区| 亚洲中文在线男人的天堂| 亚洲精品国产福利在线| 一区二区三区精品人妻| 天海翼精品久久中文字幕| 日韩中文字幕免费在线视频| 日韩精品视频香蕉视频| 亚洲中文字幕在线乱码av| 欧美丰满大屁股一区二区三区| 无套内射美女视频免费在线观看| 日本不卡片一区二区三区| 亚洲黄片在线免费小视频| 成人国产一区二区三区精品麻豆 |