基因組規(guī)模代謝網(wǎng)絡(luò)模型(Genome-scale metabolic model,GEM),是一種包含了某種特定生物或者是細(xì)胞基因組范圍代謝反應(yīng),及其酶及基因關(guān)聯(lián)的數(shù)學(xué)模型。 這里,我們基于文章的描述,介紹一款新軟件——MetaGEM。 研究者認(rèn)為,目前代謝建模的工作流程仍然是傾向于依賴參考基因組作為重建和模擬GEMs的起點(diǎn),這忽略了微生物群落中存在的物種內(nèi)和物種之間的多樣性。也限制了對(duì)已知參考基因組空間中的代謝網(wǎng)絡(luò)的分析和解釋。 可能導(dǎo)致假陽(yáng)性(即在參考基因組中存在但在群落中的變量中缺失的通路)或假陰性(即在參考基因組中缺失但在群落變量中存在的通路)結(jié)果,最終導(dǎo)致對(duì)個(gè)別物種代謝通路以及交互營(yíng)養(yǎng)共生(cross-feeding)相互作用的不準(zhǔn)確預(yù)測(cè)。 也就是說(shuō)當(dāng)前的代謝建模方法很可能無(wú)法捕捉特定物種在不同環(huán)境中的特定代謝特征,例如具有不同疾病狀況的個(gè)體的微生物群。為了克服這一局限,研究者們開(kāi)發(fā)了MetaGEM。 MetaGEM流程 MetaGEM可以不依賴參考基因組,直接從短讀的宏基因組數(shù)據(jù)中重建樣本特定的代謝模型。 下圖是該軟件的流程圖,圖中藍(lán)底白字的部分是該流程中所使用到的軟件,都是已經(jīng)由他人開(kāi)發(fā)完成的。 研究者們自己開(kāi)發(fā)的部分有兩個(gè): 一是end-to-end的框架,能夠進(jìn)行群落水平的代謝交互模擬; 二是一個(gè)來(lái)自宏基因組生物群落的14,000多個(gè)MAGs,包括3750份高質(zhì)量的MAGs,以及來(lái)自人類(lèi)腸道微生物組研究和全球微生物組項(xiàng)目的相應(yīng)的隨時(shí)可用的GEMs。 整個(gè)流程使用Snakemake實(shí)現(xiàn),從原始的宏基因組的fastq文件開(kāi)始,質(zhì)控、組裝、估計(jì)contig覆蓋率、binning、Bin的改進(jìn)和重組、MAG豐度定量和物種分類(lèi)、CarveMe進(jìn)行基因組規(guī)模代謝模型重建及質(zhì)量報(bào)告,Smetana模擬重建的基因組規(guī)模代謝模型的腸道微生物群落。 (這里只簡(jiǎn)單介紹了處理步驟,文章中的“Methods”部分有給出使用的參數(shù)) 除了以上的必備選項(xiàng),該流程還有一些附加功能可供用戶選擇??梢允褂肎RID估計(jì)中和高覆蓋率的MAGs的增長(zhǎng)率。 Prokka可以對(duì)MAGs做功能注釋,并且其結(jié)果可以提供給Roary,獲得一組MAGs的核心MAG和泛基因組的可視化結(jié)果。 EukRep可以用于尋找真核生物的MAGs。 EukCC可以對(duì)真核生物的bins做后續(xù)的分析。 流 程 特 點(diǎn) MetaGEM流程具有兩個(gè)特點(diǎn): 一是直接從宏基因組獲得高質(zhì)量的代謝重建; 二是可以為個(gè)性化的人類(lèi)腸道群落建模,研究者通過(guò)兩個(gè)實(shí)驗(yàn)進(jìn)行了描述: MetaGEM模型與EMBL、AGORA、KBase和Bigg模型相比較 用MetaGEM基于宏基因組短讀序列構(gòu)建MAGs,分為HQ(高質(zhì)量的),MQ(中等質(zhì)量的),并以此進(jìn)行代謝重建,總共獲得14087個(gè)GEMs,然后將它們與高度精選的基于參考基因組的BIGG模型、AGORA、EMBL和KBase模型進(jìn)行了比較。 利用基于定位的方法(方法)生成的豐度估計(jì)值與基于標(biāo)記基因的豐度估計(jì)值完全相關(guān); MetaGEM和其他模型都具有類(lèi)似數(shù)量的反應(yīng)和代謝物,但基因數(shù)量相比較少; 通過(guò)計(jì)算模型之間成對(duì)的代謝之間的距離,發(fā)現(xiàn)MetaGEM具有相似的酶多樣性分布; 可以捕捉到種水平物種間的顯著的代謝差異。高達(dá)60%的代謝多樣性存在于物種泛基因組中,metaGEM模型捕獲的物種內(nèi)代謝變異程度顯著 與基于參考基因組的腸道物種代謝模型AGORA比較,發(fā)現(xiàn)基于參考的模型引入的代謝反應(yīng)不一定存在于每個(gè)宏基因組環(huán)境中,而MetaGEM模型是完全基于實(shí)際的宏基因組在特定環(huán)境下重建的代謝模型。 AGORA和MetaGEM模型的EC數(shù)的交集在48.9%到69%之間,其中53.9%的情況下MetaGEM模型比相應(yīng)的AGORA模型包含更多的EC數(shù)。 研究健康和代謝受損的2型糖尿病患者腸道微生物群落中潛在的微生物代謝相互作用。 使用metaGEMs通過(guò)137個(gè)宏基因組數(shù)據(jù)重建了4127個(gè)個(gè)性化的GEMs。 根據(jù)疾病狀況分類(lèi),即正常糖耐量(NGT,n=42)、糖耐量受損(IGT,n=42)、 2型糖尿病(T2D,n=53),然后應(yīng)用Smetana軟件模擬微生物群落中的物種間依賴關(guān)系,Smetana為每個(gè)群落輸出一個(gè)分?jǐn)?shù)表,對(duì)應(yīng)于在給定條件下為支持群落成員的成長(zhǎng)而應(yīng)發(fā)生的交叉喂養(yǎng)相互作用強(qiáng)度的度量,即物種A生長(zhǎng)的可能性取決于物種B的代謝物X。 不同的2型糖尿病疾病組(NGT、IGT、T2D)相對(duì)應(yīng)的腸道代謝基因組產(chǎn)生具有不同代謝結(jié)構(gòu)的群落。 結(jié) 語(yǔ) MetaGEM具有完善的流程,搭載的工具也是生物信息分析中常用的處理工具,下載很方便,用conda就能完成。無(wú)需參考基因組,這也意味著不需要下載動(dòng)輒幾十Gb的文件。使用Snakemake做流程的自動(dòng)化管理,運(yùn)行命令簡(jiǎn)單,也可以分步驟運(yùn)行。 總體而言,MetaGEM可以直接從宏基因組數(shù)據(jù)中研究復(fù)雜微生物群落中特定樣本(sample-specific)的新陳代謝。 【附錄】 關(guān)于文中MetaGEM流程搭建所應(yīng)用到的宏基因組分析軟件,這其中也有我們常用的軟件,比如fastp、MEGAHIT、bwa、SAMtools、metaWRAP,它們?cè)谔幚頂?shù)據(jù)時(shí)非常的方便也易于上手。 參考文獻(xiàn): Zorrilla F, Patil K R, Zelezniak A. metaGEM: reconstruction of genome scale metabolic models directly from metagenomes[J]. bioRxiv, 2021: 2020.12. 31.424982. |
|
來(lái)自: 谷禾健康 > 《微信公眾號(hào):谷禾菌群空間》