原始數(shù)據(jù)極速上傳NCBI SRA教程 2017-05-31 羅春 美吉生物 美吉生物 Majorbio 擁有一流的測(cè)序平臺(tái)(Illumina)和先進(jìn)的質(zhì)譜平臺(tái)(Q-Exactive),專業(yè)提供基因組、轉(zhuǎn)錄組、宏基因組、單細(xì)胞測(cè)序、目標(biāo)區(qū)域測(cè)序、外顯子組測(cè)序等測(cè)序技術(shù)服務(wù)及蛋白組、代謝組等服務(wù),更能提供多組學(xué)解決方案,滿足各類科研需求。 近日收到的老師郵件,有相當(dāng)一部分是咨詢?nèi)绾螌?shù)據(jù)上傳NCBI數(shù)據(jù)庫(kù)的。即便小美為老師提供了NCBI上傳流程的文件,但還是有部分老師持續(xù)反映諸如: “發(fā)來的流程看著很簡(jiǎn)單啊,但為什么我上傳的時(shí)候老是報(bào)錯(cuò)???” “都過去好幾天了NCBI staff為啥還不給我SRP號(hào)呢?”等問題。 又再,又再,輾轉(zhuǎn)反側(cè)! 經(jīng)過與NCBI staff 多次溝通后,美吉精簡(jiǎn)并優(yōu)化了SRA上傳流程,不但無需單獨(dú)申請(qǐng)biosample和 bio-project,而且再也不用擔(dān)心沒有服務(wù)器、上傳慢的情況發(fā)生了。 如果說去年給大家?guī)淼呐可蟼魇莿?dòng)車組,那么今天小美這個(gè)小司機(jī)就帶大家坐次高鐵吧!
老規(guī)矩,先注冊(cè)一個(gè)“12306”的賬號(hào)(已有賬號(hào)的請(qǐng)?zhí)^,*號(hào)標(biāo)記必填,非*號(hào)標(biāo)記可不填,下同): 然后找到NCBI-submit“高鐵入口”售票廳,注意不要進(jìn)錯(cuò)了,下面的普快,你懂得! 然后完成“實(shí)名制認(rèn)證”后就可以買票上車了: 終于上車了,拿著車票左顧右盼地找到自己的座位!屁股還沒坐熱,乘務(wù)員MM就來查票了: 除了身份、車次信息外,還需要核對(duì)是否需要“補(bǔ)票”(選擇新建bioproject和biosample)? 當(dāng)然,我們最關(guān)心的還是什么時(shí)候“出站”(數(shù)據(jù)的釋放時(shí)間一般盡可能選擇文章發(fā)表之后,后續(xù)也可以根據(jù)實(shí)際需要進(jìn)行更改)! 一路顛簸之后,心中盤算著“此行的目的”(給你的實(shí)驗(yàn)取個(gè)名字并給出簡(jiǎn)要描述): 昏昏沉沉小憩一陣過后,餓意來襲,打開包裹選擇自己“喜歡的食物”(Sample Type:選擇樣本類型,參考下圖選擇,切勿亂選導(dǎo)致自己攝入過期食物而“中毒 ”(報(bào)錯(cuò))?。?/span> 那如果沒有帶吃的怎么辦?簡(jiǎn)單!到“餐車”查看售貨“清單”上都有啥?(下載下圖紅框標(biāo)識(shí)文件): 選擇合乎口味的物品加入“購(gòu)物車”(tsv文件,可用EXCEL打開,每列表格都有固定格式,特別是organism列切記準(zhǔn)確填寫,如果爆出“Warn”信息,則需要等待2個(gè)工作日方能重新進(jìn)行該步驟,別問小美為什么知道,說多都是淚),然后“付款”(選擇文件上傳),當(dāng)然他們只收“RMB”(只支持tsv或者txt格式文件上傳)! 如果沒看懂,不要緊,打開鏈接:http://www.n cbi.nlm.nih.gov/biosample /docs/submission/faq/,喝瓶原裝Coca-Cola吧(說明書)! 下一步就是批量上傳的關(guān)鍵——SRA metadata 同樣的規(guī)格,不一樣的表格,看下面(填寫規(guī)則請(qǐng)查看下載的SRA_metadata表格文件sheet3中的Library and Platform Terms信息): 乘客們注意啦!終點(diǎn)站即將到達(dá),請(qǐng)收拾好您的 “行李”(上傳原始序列文件。偷偷的告訴你,美吉生物交付客戶的原始序列文件是可以直接用于上傳SRA數(shù)據(jù)庫(kù)的)準(zhǔn)備下車! “行李”太多、太大帶不動(dòng)怎么辦(這里許多老師可能會(huì)遇到數(shù)據(jù)量大,上傳速度慢,用ftp中斷的情況),小編這里提供幾種托運(yùn)行李的工具供各位選擇: 最簡(jiǎn)單的方法如果您的樣本少,數(shù)據(jù)量小,您可以直接選擇現(xiàn)在通過網(wǎng)頁上傳。 最快速的方法這里用到NCBI推薦的aspera軟件,下載及用法見下圖: 將這些文件安裝到電腦后;運(yùn)行dos命令行窗口(怎么用看這個(gè)): 試試效果咋樣 命令行: ascp -i 之前下載key文件(帶上文件目錄) -QT -l100m(上傳最大速度) -k1 -d 數(shù)據(jù)存存放的目錄(目錄以“\”結(jié)尾) subasp@upload.ncbi.nlm.nih.gov:uploads/chun.luo@majorbio.com_KYyRWIub(郵箱_生成的隨機(jī)碼)/存放在NCBI服務(wù)器上的文件名稱(自定義)/ 當(dāng)然100M您嫌慢,您可以往上調(diào)(反正3個(gè)樣本20秒上傳完畢小美已經(jīng)很滿足啦?。?/span> 最逼格的方法如果您有服務(wù)器的情況下可在NCBI網(wǎng)頁aspera下載處找到linux版本,然后本地化到服務(wù)器上(不會(huì)?很簡(jiǎn)單,找度娘)! 同樣的方法在服務(wù)器里面就高大上了,有木有! 好啦!大家上傳完成后就到了“終點(diǎn)站”(選擇鏈接已上傳的數(shù)據(jù)文件夾); 你看“到站”了,核實(shí)一下“車站信息”: 核實(shí)沒問題后,“下車”(點(diǎn)擊submit)不一會(huì)就到“目的地”(一般半個(gè)小時(shí)后即可看到上傳成功后的SRP號(hào))啦! 不知道,小美司機(jī)這一路的引導(dǎo),各位的路途是否順利? 還沒有上傳過原始數(shù)據(jù)的老師趕快試試吧! 最后祝大家在科研的道路上一帆風(fēng)順,萬里長(zhǎng)虹?。?!
閱讀 '' |
|