@转录组组装软件----Bridger安装注意事项和使用
#前言
在很多的文章中都看到了关于转录组组装软件–Bridger的推荐,但是找遍了很多平台都没有找到详细的安装教程,众所周知,安装软件都需要去找到安装说明书,然后按照安装说明书进行安装。
实际上,对于我这种生信小白来说,还是遇到了一些安装的麻烦,所以写下这个文章希望对需要安装Bridger的人有所帮助,大家可以把安装中遇到的问题留言,我们一起探讨(其实我现在就遇到了安装问题)。
#简单介绍一下
Bridger是一种高效的RNA-Seg数据从头转录组组装器。它可以从短读(单或成对)集合所有转录本,而无需使用参考。该软件期望输入RNA-Seg以fasta或fastq格式读取,并以fasta格式输出所有组装好的候选成绩单。简单地说,它的工作分为两步:首先,Bridger将序列数据分割成许多独立的剪接图,每个图捕捉到一个特定基因或不超过几个基因的全部转录复杂性。然后,Bridger使用一个称为最小路径覆盖的严格数学模型来搜索最小路径集(转录本),这些最小路径集可以被我们的数据支持,并且可以解释每个轨迹的所有观察到的剪接事件。
#关于包的下载
#在安装Bridger时需要先安装boost(在说明书中有写)
boost安装包来源:
https://boostorg.jfrog.io/artifactory/main/release/1.78.0/source/boost_1_78_0.tar.gz
#Bridger包来源
/projects/rnaseqassembly/files/Bridger_r-06-02.tar.gz/download
#关于安装说明
安装 Boost
$ tar zxvf boost_1_78_0.tar.gz
$ cd boost_1_78_0
$ ./bootstrap.sh
$ ./b2 install --prefix=</home/czheng/boost> #设置安装路径
如果 boost安装成功就会在 /home/czheng/boost/路径地下能看到这两个文件:
/home/czheng/boost/include/
/home/czheng/boost/lib/
注意:注意boost安装路径,因为Bridger安装程序需要知道boost的路径。
环境设置
$ cd
$ vi .bash_profile
$ i
把这个export LD_LIBRARY_PATH=/home/boost/lib:$LD_LIBRARY_PATH复制在.bash_profile文件最底下。
$ :wq! #回车就会保存退出了
$ source .bash_profile #使.bash_profile文件生效。
到这里boost就安装成功了。
2.安装 Bridger
解压缩
$ tar zxvf Bridger_r-12-01
$ cd Bridger_r-12-01
**注意:**在安装的时候,遇到了bug,会出现报错和警告 “Directory creation result was not checked correctly - therefore in some cases a -Cannot create directory- error appears.或者出现Updated assemble.cpp to prevent -Cannot create directory- error.”
(See issue #5 ),在github上找到了错误文件解决方案。网址:[/fmaguire/Bridger_Assembler/pull/7/commits/5debe75e4de438966464cbc075c1604a19bd2e7c]
下面我们去解决这个安装的问题:cd Bridger_r-12-01/src 找到如图的文件,把它拿出来放windows上修改一下脚本。
删除红色部分的204到207行,用绿色的204到205的代码替换掉。
204 if (retcode == false) {
205 errAbort(const_cast<char *>(“Cannot create directory %s !\n”), out_dir.c_str());
保存文件。把assemble.cpp 上传到Linux的Bridger_r-12-01/src路径下替换掉assemble.cpp文件,这样就可以正常安装和使用了。
cd Bridger_r-12-01文件底下继续安装。
把boost的路径写在–with-boost=后面,
$ ./configure --with-boost=/home/czheng/boost/
$ make
测试一下. 在sample_test目录中提供软件分发的测试数据。
$ cd src
$ ./Assemble -h
Usage: Assemble [–reads/–kmers] [opts]
**Required :
–reads/-i : the name of the file containing reads
** Optional :
–kmer_length/-k : length of kmer, default: 25.
–double_stranded_mode : set it true if double stranded mode.
–fr_strand : strand specific protocol, default: 1
( 1 : fr-firststrand, e.g. dUTP, NSR, NNSR
2 : fr-secondstrand, e.g. Strandard SOLID )
–paired_end : set it true if paired reads.
–min_seed_coverage : minimum coverage of seed kmer, default: 2.
–min_seed_entropy : minimum entropy of seed kmer, default: 1.5
–min_kmer_coverage : minimum coverage of kmer used to extend, default: 1.
–min_kmer_entropy : minimum entroy of kmer used to extend, default: 0.0
–min_junction_coverage : minimum of the coverage of a junction, default: 2.
–min_ratio_non_error : min ratio for low/high alternative extension that is
not an error, default: 0.05.
–pair_gap_length : gap length of paired reads, default: 200.
–out_dir/-o : name of directory for output, default : ./RawGraphs
–help/-h : display the help information.
==============================================================================
测试一下数据:
$ cd sample_test/
$ ./run_Me.sh
测试好了以后我们需要进行环境配置,这样才能全局调用,步骤和boost的操作类似把这个软件的路径写在path里面 /data/users/biosoft/Bridger_r-12-01:。
# .bash_profile# Get the aliases and functionsif [ -f ~/.bashrc ]; then. ~/.bashrcfi# User zflan specific environment and startup programsPATH=$PATH:$HOME/.local/bin:$HOME/bin:/data/users/biosoft/Bridger_r-12-01:$PATHexport PATHexport LD_LIBRARY_PATH=/home/boost/lib:$LD_LIBRARY_PATH~
===============
Uasge
典型的命令格式设置如下
Bridger.pl --seqType fq --left reads.left.fq --right reads.right.fq --CPU 6 -o ./Bridger_out_dir
可以查看这里了解更多信息 :
说明书来源
说明书来源Bridger的解压文件
Bridger组装参考文献来源
[1]Chang Zheng,Li Guojun,Liu Juntao,Zhang Yu,Ashby Cody,Liu Deli,Cramer Carole L,Huang Xiuzhen. Bridger: a new framework for de novo transcriptome assembly using RNA-seq data.[J]. Genome biology,,16(2):
[2]李方东. 茶树转录组组装评估与多组学生物信息平台开发[D].安徽农业大学,.DOI:10.26919/ki.gannu..000002.
等等