宏基因組組裝基因組實現(xiàn)譜系解析MAGs achieve lineage resolution Nature Microbiology [IF: 17.745] DOI:https:///10.1038/s41564-021-01027-2 發(fā)表日期:2022-01-03 第一作者:Taylor E. Reiter1 通訊作者:C. Titus Brown (ctbrown@ucdavis.edu)1 主要單位: 1美國加州大學(xué)戴維斯分校(Department of Population Health and Reproduction, University of California, Davis, Davis, CA, USA) 正文高度準(zhǔn)確的長讀長測序和基因組聯(lián)系圖的組合已被用于從來自綿羊糞便樣本中分離出的復(fù)雜微生物群落中產(chǎn)生數(shù)百個譜系解析的宏基因組組裝基因組。 從環(huán)境測序的早期開始,通過宏基因組測序?qū)ξ⑸锘蚪M進行譜系或菌株解析重建一直是一個重要但難以實現(xiàn)的目標(biāo)。Bickhart 等人最近在 Nature Biotechnology上 發(fā)表的一篇論文通過結(jié)合使用 HiFi 測序、Hi-C 分箱和計算定相方法來解析基因組分箱,從被測序的綿羊糞便樣本中產(chǎn)生數(shù)百個譜系解析基因組,朝著這一目標(biāo)邁出了一大步。這項工作還有力地證明了通過將新的生物合成基因簇和質(zhì)粒納入基因組分箱,可以從譜系解析宏基因組學(xué)中獲得生物學(xué)見解。 至少在某些情況下,由于其菌株基因組含量的差異,同一物種的微生物在不同的微生物組中可能具有非常不同的功能。特定微生物物種的菌株特異性基因組中基因、其他遺傳元件和噬菌體島的集體存在與否,可以提供有關(guān)該菌株的功能及其棲息的微生物組的關(guān)鍵信息。 以單個譜系的分辨率理解宏基因組數(shù)據(jù)是宏基因組學(xué)的一個重要目標(biāo)。然而,在微生物組中識別或恢復(fù)菌株特異性譜系非常困難。使用 16S rRNA 和其他以基因為中心的分析進行測序不能可靠地識別譜系,也不能對整個基因組進行采樣。參考數(shù)據(jù)庫通常缺乏相關(guān)的譜系,有時甚至缺乏物種,因為許多環(huán)境沒有被采樣到足夠的深度。 宏基因組學(xué)在從宏基因組生成候選物種水平的基因組方面非常成功,即宏基因組組裝基因組 (MAGs),這種方法極大地增加了我們對生物多樣性的了解。典型的 MAG 工作流程涉及從一個或多個宏基因組數(shù)據(jù)集創(chuàng)建重疊群(contigs)的從頭組裝,然后根據(jù)組成和豐度信息,通過計算將這些重疊群“裝箱”到物種級分箱中(圖1)。 然而,這些物種級別的分箱 不包含附屬元件或宿主 - 質(zhì)粒關(guān)聯(lián),并且該方法通常涉及人工管理。 圖 1 基于宏基因組數(shù)據(jù)重建基因組Reconstructing genomes on the basis of metagenome data
從宏基因組進行譜系解析的基因組重建更具挑戰(zhàn)性,因為它必須涉及區(qū)分不同譜系之間僅略有不同的長段基因組序列。長讀長和鏈接讀長測序的進步促成了MAGs 的改進,但與提取足夠數(shù)量的高分子量 DNA、讀長、覆蓋不均勻和高測序錯誤率相關(guān)的挑戰(zhàn)阻礙了譜系特異性的確定。生物信息學(xué)方法已經(jīng)投入了相當(dāng)多的努力來從短讀長據(jù)中恢復(fù)和/或推斷譜系和譜系關(guān)聯(lián),但這些方法仍然存在潛在的偏見和缺乏直接關(guān)聯(lián)信息。 在這方面,Bickhart 等人最近的論文是一個令人興奮的進步。該研究結(jié)合了HiFi長讀長測序,其錯誤率低于其他長讀長測序方法,因此具有很高的準(zhǔn)確度,并基于序列的Hi-C圖譜進行分箱以生成高質(zhì)量的初始組裝(圖1).作者介紹了 MAGPhase,這是一種改編自轉(zhuǎn)錄本異構(gòu)體分析的定相方法,該方法使用單核苷酸多態(tài)性和測序深度來產(chǎn)生 220 個譜系解析的 MAGs。作者提出了令人信服的證據(jù),證明這些確實是單獨的譜系,包括讀長深度覆蓋圖和對裝配圖的仔細(xì)檢查。作者證明,與其他宏基因組方法相比,該技術(shù)在組裝生物合成基因簇方面具有更高的預(yù)測能力,以及重建宿主-質(zhì)粒關(guān)聯(lián)的能力。 對不同測序方法結(jié)果的評估和比較也清楚地表明了使用短讀長測序從宏基因組數(shù)據(jù)重建基因組的挑戰(zhàn)。在方法的直接比較中,Bickhart 等人表明,他們的許多 HiFi 譜系解析分箱基因組被非 HiFi 讀長折疊成包含多個譜系的單個分箱。他們還表明,短讀長比對無法可靠地區(qū)分 HiFi 基因組的高度重復(fù)或直系同源基因區(qū)域中的多態(tài)位點,突出了計算解決短讀長譜系的挑戰(zhàn)。 這并不是說基于 HiFi 的方法在當(dāng)前狀態(tài)下是無偏差的。這些偏差包括高豐度群落成員的有限重建,以及基于用于長讀長DNA提取實驗方法的明顯分類學(xué)偏差。此外,新技術(shù)并沒有改善從宏基因組中回收真核基因組,并且對于完整的病毒顆粒捕獲和基因組重建可能需要不同的DNA制備步驟。無論如何,這項技術(shù)為宏基因組學(xué)領(lǐng)域提供了一套探索生態(tài)進化壓力的方法,這些壓力塑造了微生物群落,否則鑒于以前MAGs 的局限性,這些壓力是不合適的。其中包括在分離物測序方面首創(chuàng)的方法,例如根據(jù)非同義和同義替代率估計自然選擇的模式和強度、跟蹤水平基因轉(zhuǎn)移和重建泛基因組。 當(dāng)然,仍然存在許多挑戰(zhàn)。Bickhart 等人的研究雖然很有前景,但使用了依賴高濃度優(yōu)質(zhì) DNA 的昂貴測序技術(shù)。需要進一步的研究來確定這里采用的技術(shù)是否可以應(yīng)用于更復(fù)雜的環(huán)境樣本,例如來自海洋和土壤的環(huán)境樣本,這些樣本更加多樣化,并且通常會帶來巨大的 DNA 提取挑戰(zhàn)。還需要大量的計算進步來正確分析和關(guān)聯(lián)即將由這些方法產(chǎn)生的大量的譜系解析的基因組序列,并且需要新的方法將譜系解析的基因組信息與微生物組生物學(xué)聯(lián)系起來。Bickhart 等人取得的進展使該領(lǐng)域從概念化這些挑戰(zhàn)轉(zhuǎn)向解決它們。
ReferenceTaylor E. Reiter,C. Titus Brown.MAGs achieve lineage resolution. Nature Microbiology,(2022). https:///10.1038/s41564-021-01027-2 |
|