利用MISA鉴定简单重复序列(SSR)

楼主  收藏   举报   帖子创建时间:  2018-10-04 00:00 回复:1 关注量:165

在基因组中存在着大量的重复序列,根据其重复的程度可分为简单重复序列、中度重复序列和高度重复序列。简单重复序列(Simple Sequence Repeat,SSR)在真核生物基因组中广泛存在,一般是以1-6bp组成较低程度的重复序列,主要以2-3个核苷酸为重复单位如(GA)n、(AC)n和(GAA)n等。从进化角度看物种间重复序列的差异是自然选择的结果。因此鉴定SSR在基因组分析中有重要意义。

今天给大家推荐一款鉴定简单重复序列的软件MISAMIcroSAtellite identification tool)。MISA是一个用perl语言写的一个从fasta序列中鉴定SSR的脚本。

该软件下载地址:http://pgrc.ipk-gatersleben.de/misa/

下面是软件的附带的使用说明。

运行MISA时还需要另外一个文件,misa.ini。该文件记录鉴定的SSR的参数。默认情况下:

第一行:definition(unit_size,min_repeats) 是SSR pattern

第二行:interruptions(max_difference_for_2_SSRs)是两个SSR之间的间隔。

筛选标准为:单核苷酸重复的次数在16次或 16次以上 ,二核苷酸重复的次数在 6次或 6次以上 ,三至六核苷酸重复的次数在 5次或 5次以上等。同时 ,也筛选中间被少数碱基 (间隔小于100或等于100)打断的 ( interrupted)不完全重复的SSR)

运行前将misa.ini与misa.pl 放在一起,输入的序列存在fasta文件里面,然后运行下面的命令:

  • ***来自外部的引用: 1使用Misa结合Primer3来批 1970-01-01 08:00
    #1