安装
mamba create -n CAT python=3.10 diamond prodigal
cd SoftWare
git clone https://github.com/MGXlab/CAT_pack
chmod 755 给权限
自己构建数据库
names.dmp nodes.dmp文件可以在Kraken2的文件里面找到 Kraken2+Bracken:宏基因组物种注释_kracken2配合bracken-CSDN博客
我用的是IMG/VR4的蛋白数据库,费了好大劲吧蛋白id和taxid联系起来
接着
~/CAT_pack/CAT_pack/CAT_pack prepare --db_fasta IMGVR_all_proteins-high_confidence.faa \
--names ~/database/kraken2/Standard/taxonomy/names.dmp \
--nodes ~/database/kraken2/Standard/taxonomy/nodes.dmp \
--acc2tax protein_taxid.txt --db_dir IMG_faa_CAT#结果
[2024-04-26 09:56:04] CAT_pack prepare is done!Supply the following arguments to CAT, BAT, or RAT if you want to use this database:
-d / --database_folder ~/IMG_faa_CAT/db
-t / --taxonomy_folder ~/IMG_faa_CAT/tax
比对
CAT_pack contigs -c {contigs fasta} -d {database folder} -t {taxonomy folder}#名字
CAT_pack add_names -i {ORF2LCA / classification file} -o {output file} -t {taxonomy folder} --only_official
默认数据库
Index of /tina/CAT_pack_prepare
解压之后用法一样