使用MaSuRCA进行基因组组装

楼主  收藏   举报   帖子创建时间:  2018-03-26 00:00 回复:6 关注量:141

1. MaSuRCA 简介

MaSuRCA(Maryland Super Read Cabog Assembler)基因组组装软件集合了 de Bruijn 和 Overlap-Layout-Consensus 的优点。
文献:Zimin A V, Marçais G, Puiu D, et al. The MaSuRCA genome assembler[J]. Bioinformatics, 2013, 29(21): 2669-2677.

2. MaSuRCA 下载和安装

3. MaSuRCA 使用

3.1 配置文件准备

将模板配置文件 “/opt/biosoft/MaSuRCA-2.2.1/sr_config_example.txt” 拷贝到当前工作目录,并修改之。此配置文件含有输入文件和参数 的一些信息。内容如下:

3.2 运行 masurca 和 assemble.sh 进行基因组组装

运行程序 masurca,生成 assemble.sh; 然后运行 assemble.sh 进行组装。

3.3 运行中断后继续运行

由于程序出错,或手动终止后,可以终止步骤所生成的文件,在继续运行 masurca ,生成含有后续步骤的 assemble.sh,再继续运行程序。

4. 结果文件

最终的结果文件为 CA/10-gapclose/genome.ctg.fasta 。

原文来自:http://www.chenlianfu.com/?p=2107

  • ***1514033532 2014-12-09 20:50
    #1

    Configuration. To run the assembler, one must first create a configuration file that specifies the location of the executables, data and assembly parameters for the assembler. The installation script will create a sample config file ‘sr_config_example.txt’. Lines starting with a pound sign (‘#’) are comments and ignored. The sample configuration file looks like this.

  • ***masurca configuration.txt 未 1970-01-01 08:00
    #2

  • ***1514033532 2014-12-09 20:51
    #3

    ~/DNA/zuzhuang/MaSuRCA-2.3.2/bin$ masurca configuration.txt 未找到命令????

  • ***1123 2014-12-24 10:46
    #4

    line 35 是end函数在最后一行,提示end不行;runCA OKcreateSuperReadsForDirectory.perl OKError: Modification of a read-only value attempted at masurca line 107, line 35.

  • ***2minky 2015-03-09 10:10
    #5

    一样的问题,但我这里illumina数据运行没有问题,是454数据用fastqToCA生成frg后运行出现这个错误

  • ***1Harry 2015-07-13 17:17
    #6

    ERROR: Failed with signal HUP (1)runCA failed.gatekeeper failed出现这些错误是什么回事