mafft+phylosuite+raxml


构建系统发育树
有参考《Genomes of Subaerial Zygnematophyceae Provide Insights into Land Plant Evolution》
最后决定用mafft+phylosuite+raxml

首先需要将序列进行比对 在这里使用mafft

conda install mafft
mkdir mafft && cd mafft
mafft --maxiterate 1000 --localpair input.fa > output.fa

下载phylosuite主要用来提取保守序列

配着这三处设置即可得到提取好的序列

之后将fasta转化成phylip格式,这里不详细写了。

最后直接用conda安装raxml

raxmlHPC -f a -x 12345 -p 12345 -# 100 -m PROTGAMMALGX -s ex.phy -n ex -T 20
-f a
此参数用于选择 RAxML 运算的算法。可以设定的值非常之多。 a 表示执行快速 Bootstrap 分析并搜索最佳得分的 ML 树。
-x 12345
指定一个 int 数作为随机种子,以启用快速 Bootstrap 算法。
-p 12345
指定一个随机数作为 parsimony inferences 的种子。
-# 100
指定 bootstrap 的次数。
-m PROTGAMMALGX
指定核苷酸或氨基酸替代模型。PROTGAMMALGX 的解释: "PROT" 表示氨基酸替代模型; GAMMA 表示使用 GAMMA 模型; X 表示使用最大似然法估计碱基频率。
-s ex.phy
指定输入文件。phy 格式的多序列比对结果。软件包中包含一个程序来将 fasta 格式转换为 phy 格式。
-n ex
输出文件的后缀为 .ex 。
-T 20
指定多线程运行的 CPUs 。

到这里发现报错了,原因我猜是raxml没安装好,试了一下绝对路径就成功了。

相关