NCBI中各符号代表的意思

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

GenBank 中字符的意思Nucleotide 数据库分为三个子数据库:

·EST :表达序列标记数据库

·GSS :基因组测序序列数据库

·CoreNucleotide :包含所有未被以上两个子数据库收录的核苷酸序列

●MeSH: 查询缩写基因的全称

3、RefSeq(Reference Sequence)序列接受号:

(1)mRNA 记录(NM_*):

e.g.:NM_000492

(2)基因组的DNA重叠群(NT_*):

e.g.:NT_000347

(3)完整的基因组或染色体(NC_*):

e.g.:NC_000907

(4)基因组的局部区域(NG_*):

e.g.:NG_000019

页脚内容1

(5)从人类基因组注释、加工得到的序列模型(XM,XP,or XR_*):

e.g.:XM_000483

●GenBank记录中特性表中的主要关键词:

关键词解释关键词解释

misc_feature生物学特性无法用特

性表关键词描述的序

promoter转录起始区

misc_difference序列特性无法用特性

表关键词描述的序列CAAT_signal真核启动子上游的

CAAT盒,与RNA结合相

conflict同一序列在不同的研

究中在位点或区域上

有差异

TATA_signal真核启动子的TATA盒

unsure序列不能确定的区域-35_signal原核启动子中的-35

old_sequence该序列对以前的版本-10_signal原核启动子的Pribow

页脚内容2

做过修订盒

variation包含稳定突变的序列GC_signal真核启动子的GC盒modified_base修饰过的核苷酸RBS核糖体结合位点

gene已识别为基因或已命

名的序列区域polyA_signal RNA转录本的剪切识

别位点

misc_signal无法用信号特性关键

词描述的信号序列

enhancer增强子

关键词解释关键词解释attenuator与转录终止有关的序列CDS蛋白质编码序列terminator转录终止序列sig_peptide编码信号肽的序列rep_origin双链DNA复制起始区transit_peptide转运蛋白编码序列misc_RNA无法用RNA关键词描述的转录

物或RNA产物

mat_peptide编码成熟肽的序列

页脚内容3

prim_transcript初始转录本intron内含子

precursor_RNA前体RNA polyA_site RNA转录本的多聚腺苷酸化

位点

mRNA信使RNA rRNA核糖体RNA

5’clip前体转录本中被剪切掉的5’

端序列

tRNA转运RNA

3’ clip前体转录本中被剪切掉的3’

端序列

scRNA小细胞质RNA

5’UTR5’非翻译区snRNA小核RNA

3’UTR exon 3’非翻译区

外显子

snoRNA加工和修饰rRNA的小核RNA

关键词解释关键词解释immunoglobulin_related repeat_unit单个的重复元件C_region免疫相关蛋白上的不变区LTR长末端重复序列

页脚内容4

D_segment免疫球蛋白重链的可变区,

T细胞受体β链

Satellite卫星重复序列

J_ segment免疫球蛋白重链、轻链以及T

细胞α、β、γ的结合链misc_binding无法描述的核酸序列结

合位点

N_ region插入重排免疫球蛋白片段间

的核苷酸primer_bind复制、转录的引物结合位

S_ region免疫球蛋白重链的开关区protein_bind蛋白质结合区

V_ region编码免疫球蛋白的可变区N末

端的序列

STS测序标签位点

V_ segment编码免疫球蛋白的可变区的

序列misc_recomb无法用重组特性关键词

描述的重组事件

repeat_region基因组中所包含的重复序列iDNA通过重组所消除的DNA

misc_structure无法用结构关键词描述的核

酸序列高级结构或构型

stem_loop发夹结构

D_loop线粒体中DNA中的取代

页脚内容5

◆GenBank记录中特性表中的限定词:

限定词含义限定词含义

/allele=给定基因的等位基因/codon_start=相对于序列第一个碱基,

编码序列密码子的偏移量/bound_moiety=嵌合范围/country=DNA样本的来源国

/cell_type=获得序列的细胞类型/db_xref=其他数据库信息的交叉索

引号

/citation=已被引用的参考文献数/direction=DNA复制方向

/clone_lib=获得序列的克隆文库/environmental_sample=序列直接从环境材料中获

得而没有指明来源物种

限定词含义限定词含义

/exception=指明DNA序列未按通常的生物

/PCR_conditi-ons=描述PCR的反应条件

学规律翻译,如RNA编辑

页脚内容6

相关文档
最新文档