700字范文 > 使用Kaiju无组装计算宏基因组数据物种注释相对丰度

使用Kaiju无组装计算宏基因组数据物种注释相对丰度

时间：2020-04-11 22:51:58

关于Kaiju

Kaiju是一款直接通过宏基因组数据Read获得物种注释信息并计算读数与相对丰度的软件。它的主要方法是将Read核酸序列翻译为蛋白序列然后在相应的数据库中进行精确比对，确认物种分类信息。

Kaiju 安装与数据库下载

Kaiju的安装可以参考其Github上给出的步骤。

由于Kaiju的运行需要参考数据库的比对，所以提前要下载好数据库，数据库可以通过kaiju-makedb命令下载。但是由于我这边不能直接用网关账号登录的服务器进行下载，所以是在组里对外服务器上下载的，可以去Kaiju web server下载，该页面左侧显示了下载链接，复制链接后使用wget命令就可以下载了。

我下载的数据库是：NCBI BLAST Nr库，下载下来后是tgz格式，用tar xzvf命令解压就可以了，解压后会得到3个文件：

names.dmpnodes.dmpkaiju_db_nr_euk.fmi

这三个文件需要在运行kaiju时指定，存好记下绝对路径就可以了。

Kaiju主程序

kaiju -z 64 -t ~/softwares/kaiju/kaijudb/nodes.dmp \-f ~/softwares/kaiju/kaijudb/kaiju_db_nr_euk.fmi \-i ~/hotspring/NGS/dedupe/1A_dedupe_R1.fq \-j ~/hotspring/NGS/dedupe/1A_dedupe_R2.fq \-o 1A.kaiju.out

-z参数调整线程数，-f对应刚才解压数据库得到的.fmi文件，然后-i -j分别是双端R1 R2序列文件，-o是输出文件。

输出结果用kaiju2table命令可以转化为容易处理的形式。

kaiju2table -t ~/softwares/kaiju/kaijudb/nodes.dmp \-n ~/softwares/kaiju/kaijudb/names.dmp -u \-o 1A.classification.summary.class.tsv -r class 1A.kaiju.out

-t -n分别指定刚才解压数据库得到的nodes.dmp和names.dmp，-u代表unclassified的序列不加入相对丰度计算，-o是输出文件，-r可以填写phylum, class, order, family, genus, species，分别表示显示在这六种分类层级下的分类结果。最后一个参数是主程序的输出文件。

输出结果示例

上图就是kaiju2table的结果在Excel中的部分展示，这个输出是phylum水平的，显示了相对丰度以及序列数。

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。