一、AAI
氨基酸一致性amino acid identity(AAI)是获得属或更高分类群分类结构的一种客观方法。常用工具:
- CompareM:github说明
安装使用参考利用ANI AAI比较细菌基因组
作者已经不再维护,并推荐了AAI calculator和 EzAAI tool
- AAI calculator:在线工具,以蛋白质序列作为输入文件
- EzAAI tool:从基因组组装到最终树状图的快速而准确的管道
Kim, D., Park, S. & Chun, J. Introducing EzAAI: a pipeline for high throughput calculations of prokaryotic average amino acid identity. J. Microbiol 59, 476-480 (2021). (https://doi.org/10.1007/s12275-021-1154-0)
二、软件使用
2.1 软件安装
- EzAAI v1.0
- Java RE 8+ :java8参考ubuntu配置jre8
- Prodigal : 用conda安装,conda install -c bioconda prodigal
- MMSeqs2: 用conda安装, conda install -c bioconda mmseqs2
2.2 软件使用
EzAAI extract 从基因组序列中提取profile数据库
$ java -jar EzAAI_latest.jar extract -i fasta/Cn.fasta -o db/Cn.db -l "Clavibacter nebraskensis"
$ java -jar EzAAI_latest.jar extract -i fasta/Ci.fasta -o db/Ci.db -l "Clavibacter insidiosus"
$ java -jar EzAAI_latest.jar extract -i fasta/Mh.fasta -o db/Mh.db -l "Microbacterium hominis"
$ java -jar EzAAI_latest.jar extract -i fasta/Ma.fasta -o db/Ma.db -l "Microbacterium aurum"
$ java -jar EzAAI_latest.jar extract -i fasta/Lc.fasta -o db/Lc.db -l "Leucobacter chironomi"
$ java -jar EzAAI_latest.jar extract -i fasta/Lm.fasta -o db/Lm.db -l "Leucobacter muris"
EzAAI calculate 从profile数据库计算AAI值
EzAAI将自动检测目录中的.db文件,并使用MMSeqs2计算每株菌与其他菌之间的AAI值。
$ java -jar EzAAI_latest.jar calculate -i db/ -j db/ -o out/aai.tsv
EzAAI cluster - 通过AAI值做层次聚类
$ java -jar EzAAI_latest.jar cluster -i out/aai.tsv -o out/sample.nwk
生成的nwk文件用MEGA做可视化
完成!