今天給大家分享一下怎么利用R來進行多序列比對,并進行可視化。我們利用多個物種的PAH基因?qū)?yīng)的蛋白序列進行演示。#安裝Biostrings和msa包 BiocManager::install("Biostrings") BiocManager::install("msa")
#加載Biostrings和msa包 library(Biostrings) library(msa)
#讀取到變量中 PH4H_AA <- readAAStringSet("PH4H_AA.fasta") #輸出查看 PH4H_AA
#默認使用ClustalW進行多序列比對 PH4HAlignment <- msa(PH4H_AA) PH4HAlignment
#顯示完整比對情況 print(PH4HAlignment, show="complete")
#保存多序列比對fasta文件 #繪制比對結(jié)果圖,帶seqlogo msaPrettyPrint(PH4HAlignment, #多序列比對變量 alFile="PH4H_aligment_result.fasta", #保存多序列比對結(jié)果到fasta文件 output="pdf", #繪制多序列比對結(jié)果到pdf文件 showNames="left", #左側(cè)展示序列名稱 showLogo="top", #上方展示seqlogo showLogoScale="left", #左側(cè)顯示seqlogo的垂直軸 showConsensus="bottom", #下方展示consensus序列 showNumbering="right", #顯示序列的位置 askForOverwrite=FALSE, #詢問是否覆蓋同名文件 verbose=T) #展示代碼運行的詳細信息
運行結(jié)束之后,在同一個文件夾下面,我們就能得到PH4H_aligment_result.fasta和PH4HAlignment.pdf。為了方便大家交流學(xué)習(xí),共同進步,我特地創(chuàng)建了微信交流群
|