https://github.com/sanger-pathogens/circlator 其實(shí)這是一個(gè)序列拼接組裝的工具 不過(guò)筆者覺(jué)得最有用的還是序列起點(diǎn)的錨定功能。 我們知道細(xì)菌基因組大多是一個(gè)環(huán)形,而我們的組裝結(jié)果(哪怕是基因組完成圖)也只能用一條序列來(lái)表示,那么起始點(diǎn)在哪里?這就是一個(gè)需要工具錨定的工作了。 這妥妥是一個(gè)生物信息分析的工作,當(dāng)然需要相應(yīng)的工具來(lái)解決。 解決的方法有很多種,筆者自己喜歡用Circlator。 安裝和使用都較為簡(jiǎn)單 安裝方法:
使用方法
示例程序里的Old.fasta為輸入文件,New.fasta為輸出結(jié)果,已經(jīng)錨定了起始和終止位置(默認(rèn)從dnaa基因序列作為起始位點(diǎn),如果想選擇其他基因作為起始點(diǎn),增加參數(shù)--genes_fa Genes.fa ,即提供起始點(diǎn)的核酸序列)。 經(jīng)過(guò)以上處理的細(xì)菌基因組,從相同的起始點(diǎn)開(kāi)始,正如比賽時(shí)有了同一起跑線,對(duì)我們后續(xù)分析會(huì)起一定的簡(jiǎn)化作用。 不過(guò)說(shuō)實(shí)話,其實(shí)不做這步也沒(méi)太大關(guān)系,沒(méi)有根本性的大差別,很多時(shí)候我只是自己跟自己過(guò)不去罷了 長(zhǎng)按關(guān)注 公眾號(hào)名稱:微微悅明 科學(xué)的樂(lè)趣是獲得新知識(shí)的喜悅~ 高通量測(cè)序、大數(shù)據(jù)病原微生物檢測(cè)和監(jiān)測(cè)健康大數(shù)據(jù)行業(yè)資訊記錄與分享 |
|