微生物群落可能包括密切相關(guān)的不同譜系,這使得宏基因組的組裝變得復(fù)雜,并阻礙了完整宏基因組微生物基因組(MAGs)的組裝。研究人員發(fā)現(xiàn),長讀長高精準(zhǔn)的HiFi測序與Hi-C分箱相結(jié)合可以解決這一挑戰(zhàn),能夠區(qū)分幾乎相同的生物,甚至可用于復(fù)雜的微生物群落,使得研究人員可以更完整全面地分類微生物群落。 美國農(nóng)業(yè)部Timothy P. L. Smith、加州大學(xué)舊金山分校Pavel A. Pevzner等研究人員,利用HiFi測序結(jié)合先進(jìn)的算法,從復(fù)雜微生物群落中生成親緣關(guān)系相近的完整宏基因組組裝MAGs。這一研究成果于2022年1月3日發(fā)表在《Nature Biotechnology》(IF=54.908)期刊,論文題為“Generating lineage-resolved, complete metagenome-assembled genomes from complex microbial communities”(https:///10.1038/s41587-021-01130-z)。本研究對(duì)綿羊糞便進(jìn)行了宏基因組HiFi測序,通過宏基因組數(shù)據(jù)結(jié)合Hi-C binning方法,組裝到428個(gè)MAGs,完整度超過90%,其中包括44個(gè)單個(gè)環(huán)狀contigs的MAGs。圖1 Contigs水平比較pCLR和HiFi組裝 圖2 HiFi宏基因組組裝低豐度物種MAGs 圖3 組裝得到的MAGs系統(tǒng)發(fā)育進(jìn)化樹 為了解決區(qū)分高度相似的菌株問題,研究人員采用了一種由Pevzner實(shí)驗(yàn)室開發(fā)的組裝算法——metaFlye。同時(shí),他們還用PacBio的程序MAGPhase來區(qū)分單個(gè)樣本中非常相似的細(xì)菌菌株,即通過區(qū)分?jǐn)?shù)萬堿基的基因組序列中的SNP單倍型來區(qū)分相似微生物。MAGPhase在本數(shù)據(jù)集中確定了220個(gè)親緣關(guān)系高度相似的MAGs。圖4 使用MAGPhase在宏基因組中進(jìn)行SNP單倍型檢測 圖5 不同測序深度的MAGs組裝結(jié)果 MAGs的總數(shù)量和完整性隨測序深度的增加而增加 HiFi解析復(fù)雜微生物群落中密切相關(guān)微生物的能力提高有著廣泛的應(yīng)用,例如,生物合成基因簇的鑒別以及移動(dòng)遺傳元件與宿主關(guān)聯(lián)的精確度。研究人員利用Hi-C分箱確定了1,400個(gè)完整的和350個(gè)部分的生物合成基因簇,其中大部分是新發(fā)現(xiàn)的。同時(shí)鑒定了424個(gè)潛在的宿主-病毒(其中298個(gè)宿主-質(zhì)粒關(guān)聯(lián))。鑒定綿羊及其他牲畜的微生物組還有助于開發(fā)方法來減少疾病和溫室氣體排放。菌株水平的基因組解析將有助于追蹤與抗生素耐藥性有關(guān)的基因,并確定畜牧業(yè)導(dǎo)致人類和動(dòng)物疾病中抗生素耐藥性上升的程度。 圖5 HiFi reads提高了移動(dòng)遺傳元件與候選宿主物種的關(guān)聯(lián) 總之,HiFi宏基因組能夠跨越直系同源基因組區(qū)域并解析物種水平和菌株水平單個(gè)微生物基因組,獲得復(fù)雜細(xì)菌群落的真正宏基因組MAGs。由此產(chǎn)生的譜系解析完整MAGs是邁向“完整宏基因組學(xué)”的一步——從復(fù)雜的宏基因組樣本中分離出高質(zhì)量微生物基因組。所以,就像將完整基因組應(yīng)用于罕見病診斷一樣,完整宏基因組學(xué)將可能很快就進(jìn)入醫(yī)學(xué)和許多其他學(xué)科。參考文獻(xiàn) Generating lineage-resolved, complete metagenome-assembled genomes from complex microbial communities. Nature Biotechnology, 2022.
|