扫盲贴:NCBI上的这些字母都是些什么鬼

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

扫盲贴:NCBI上的这些字母都是些什么鬼
——日读一帖,解螺旋大V团队伴你科研路
解螺旋出品,转载须经授权
NCBI上基因前面有个accession(编号)分别有NC、NM、NP、GI、XP、XM、BC、AB、NG、AJ、AC、AY和AF等等,然后后面是一串数字,比如:
天哪,这都是些什么鬼!!特别是看Blast结果时,这些编号到处都是的,根本不知道哪个才是想要的好么!
莫慌,麦子今天就给大家理理顺!
ACCESSION是NCBI序列数据中我们常用到编号(另一个是GI)。

ACCESSION形式为CC_#####,其中CC为两个字母,其不同组合又可以区分为蛋白序列、核酸序列或基因组序列,而#为位数不等的数字;ACCESSION后面又会加版本号,以CC_####.#形式表示,最后的尾数递增表示序列信息较之前的版本有所修改。

这样ACCESSION+版本号就是一个唯一的表示,代表一个唯一的序列,而且这个编号不会改变。

以下是麦子帮大家找到的整理表格!具体的各项说明及序列来源说明可以查看NCBI(/refseq/about/)
一般来说,mRNA和基因组序列是我们主要的寻找对象。

如果想找标准序列的话,mRNA就采用NM_开头的,基因组用NC_或者AC_开头的。

so easy!
不同的编码代号代表不同的意思,如NM_开头的表示标准序列,XM_表示预测的蛋白编码序列,NR_表示非编码蛋白的mRNA序列,AF开头的表示克隆序列,BC开头的表示模板序列......
上面的表格中是一些常见序列的accession号,不过大家知道NCBI中还有很多其他的accession号么?!其中,仅与RNA相关的就有116种!不过,科研人员生存不易,不必在细节上作死自己,麦子建议大家按需选择或者需要时查询即可!。

相关文档
最新文档