700字范文,内容丰富有趣,生活中的好帮手!
700字范文 > 使用Kaiju无组装计算宏基因组数据物种注释相对丰度

使用Kaiju无组装计算宏基因组数据物种注释相对丰度

时间:2020-04-11 22:51:58

相关推荐

使用Kaiju无组装计算宏基因组数据物种注释相对丰度

关于Kaiju

Kaiju是一款直接通过宏基因组数据Read获得物种注释信息并计算读数与相对丰度的软件。它的主要方法是将Read核酸序列翻译为蛋白序列然后在相应的数据库中进行精确比对,确认物种分类信息。

Kaiju 安装与数据库下载

Kaiju的安装可以参考其Github上给出的步骤。

由于Kaiju的运行需要参考数据库的比对,所以提前要下载好数据库,数据库可以通过kaiju-makedb命令下载。但是由于我这边不能直接用网关账号登录的服务器进行下载,所以是在组里对外服务器上下载的,可以去Kaiju web server下载,该页面左侧显示了下载链接,复制链接后使用wget命令就可以下载了。

我下载的数据库是:NCBI BLAST Nr库,下载下来后是tgz格式,用tar xzvf命令解压就可以了,解压后会得到3个文件:

names.dmpnodes.dmpkaiju_db_nr_euk.fmi

这三个文件需要在运行kaiju时指定,存好记下绝对路径就可以了。

Kaiju主程序

kaiju -z 64 -t ~/softwares/kaiju/kaijudb/nodes.dmp \-f ~/softwares/kaiju/kaijudb/kaiju_db_nr_euk.fmi \-i ~/hotspring/NGS/dedupe/1A_dedupe_R1.fq \-j ~/hotspring/NGS/dedupe/1A_dedupe_R2.fq \-o 1A.kaiju.out

-z参数调整线程数,-f对应刚才解压数据库得到的.fmi文件,然后-i -j分别是双端R1 R2序列文件,-o是输出文件。

输出结果用kaiju2table命令可以转化为容易处理的形式。

kaiju2table -t ~/softwares/kaiju/kaijudb/nodes.dmp \-n ~/softwares/kaiju/kaijudb/names.dmp -u \-o 1A.classification.summary.class.tsv -r class 1A.kaiju.out

-t -n分别指定刚才解压数据库得到的nodes.dmpnames.dmp-u代表unclassified的序列不加入相对丰度计算,-o是输出文件,-r可以填写phylum, class, order, family, genus, species,分别表示显示在这六种分类层级下的分类结果。最后一个参数是主程序的输出文件。

输出结果示例

上图就是kaiju2table的结果在Excel中的部分展示,这个输出是phylum水平的,显示了相对丰度以及序列数。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。