基因组注释分析主要包括哪些内容 ?

楼主  收藏   举报   帖子创建时间:  2019-01-09 00:00 回复:0 关注量:89

基因组注释包括以下方面的内容:

(1) 重复序列的预测。通过比对已知的重复序列数据库,找出序列中包含的重复序列,识别类型并转化为N或者X,统计各种类型重复序列的分布。

(2) 编码基因的预测。通过将转录组或EST数据比对到拼接后的基因组序列上,找出编码基因位置,预测编码基因结构。或者通过专业的外显子预测软件,预测编码基因的外显子结构。

(3) 小RNA基因的预测。通过比对已知的小RNA的数据库,或者通过生物信息学软件预测,找出这些小RNA基因,并进行分类。

(4) 调控序列和假基因的预测。

基因功能的注释,使用的数据库包括NT/NR, SwissProt/TrEMbl, InterPro, KEGG, COG, Gene ontology等,使用比对的方法,如blast,找出同源相近的基因,并注释功能。

基因组注释的一般流程和内容