NCBI中RefSeq各种accession说明(一)
我们在NCBI上找序列时,特别是看Blast结果时,经常会看到各种标记的序列,不知道哪个才是想要的,特此查了相关资料,找到了一些说明。根据个人经验,如果想找标准序列的话,mRNA就采用NM_开头的,基因组用NC_或者AC_开头的,有关RNA的编号说明,可以参考下一篇文章。
具体的各项说明及序列来源说明请参考NCBI说明
Accession | Molecule | Method | Note |
---|---|---|---|
AC_123456 | Genomic | Mixed |
一些可供选择的注释的基因组序列,主要用来标记病毒和原核生物。 |
AP_123456 | Protein | Mixed |
AC_标记序列对应的蛋白产物。 |
NC_123456 | Genomic | Mixed |
完整的基因组分子序列,标记的类别包括基因组、染色体、细胞器、质粒。 |
NG_123456 | Genomic | Mixed |
不完整的基因组区域,提供NCBI基因组注释途径。比较有代表性有不转录的假基因或者那些很难自行化注释的基因组簇。 |
NM_123456 NM_123456789 |
mRNA | Mixed |
转录产物序列;成熟mRNA转录本序列。 |
NP_123456 NP_123456789 |
Protein | Mixed |
蛋白产物;主要是全长转录氨基酸序列,但也有一些只有部分蛋白质的部分氨基酸序列。 |
NR_123456 | RNA | Mixed |
非编码的转录子序列,包括结构RNAs,假基因转子等。 |
NT_123456 | Genomic | Automated |
BAC或者鸟枪测序法的还未完全注释的测序序列。 |
NW_123456 NW_123456789 |
Genomic | Automated | BAC或者鸟枪测序法的还未完全注释的测序序列。 |
NZ_ABCD12345678 | Genomic | Automated |
收集的各种利用鸟枪法测序的测序计划,ABCD代表的是计划的名称。 |
XM_123456 XM_123456789 |
mRNA | Automated |
转录产物;mRNA来自基因组注释,序列相当于基因组重叠群。 |
XP_123456 XP_123456789 |
Protein | Automated | 蛋白产物。序列相当于基因组重叠群。 |
XR_123456 | RNA | Automated | 转录产物;非编码区来自基因组注释,序列相当于基因组重叠群。 |
YP_123456 YP_123456789 |
Protein | Mixed |
蛋白产物。不涉及到转录,主要用来标记细菌、病毒和线粒体。 |
ZP_12345678 | Protein | Automated | 蛋白产物,主要是用电脑自动注释。 |
NS_123456 | Genomic | Automated | 未知生物分子基因组序列。 |
相关推荐:
- 吃豆腐新解 439
- 怎样向NCBI提交基因序列 438
- Perl输出函数传递的二维数组 422
- centOS7 安装mysql5.6 390
- Bioperl的简单快速安装 387
-
匿名 2015-12-30 13:57#2
有用,非常感谢!
-
匿名 2017-02-21 17:26#3
感谢
-
匿名 2017-05-02 16:40#4
非常感谢~
-
DD 2018-01-16 11:47#5
有些时候后面还会加个.3或者.4类似的情况,这个点后面的信息代表什么呢?
-
hxw 2018-01-16 14:51#6
那是更新的版本号,如3表示是第三次更新的数据。
-
匿名 2018-01-23 12:19#7
有时候碰到这些问题一下就蒙住了,非常感谢
-
匿名 2018-02-08 12:17#8
非常感谢
-
匿名 2018-02-16 13:16#9
NM NP 是动物等自然中存在的序列。XM 和 XP 可以理解成自然中不存在的,而是电脑预测出来的序列么?
-
匿名 2018-05-10 11:14#10
谢谢
最新创建圈子
-
原料药研发及国内外注册申报
2019-01-25 10:41圈主:caolianhui 帖子:33 -
制药工程交流
2019-01-25 10:40圈主:polysciences 帖子:30 -
健康管理
2019-01-25 10:40圈主:neuromics 帖子:20 -
发酵技术
2019-01-25 10:39圈主:fitzgerald 帖子:17 -
医学肿瘤学临床试验
2019-01-25 10:39圈主:bma 帖子:58
有用,谢谢!