常用生物数据库 外显子、内含子、mRNA、CDS

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

常用生物数据库

核酸序列数据库主要有GenBank, EMBL, DDBJ等.

蛋白质序列数据库有SWISS-PROT, PIR, OWL, NRL3D, TrEMBL等,蛋白质片段数据库有PROSITE, BLOCKS, PRINTS等,

三维结构数据库有PDB, NDB, BioMagResBank, CCSD等,

蛋白质结构有关的数据库还有SCOP, CATH, FSSP, 3D-ALI, DSSP等,与基因组有关的数据库还有ESTdb, OMIM, GDB, GSDB等,

文献数据库有Medline, Uncover等。

外显子、内含子、mRNA、CDS

1.DNA复制:以DNA为模板,在DNA聚合酶的催化作用下,将四种游离的dNTP按照碱基互补配对原则合成新链DNA

转录:以DNA为模版,在DNA指导的RNA聚合酶的作用下,将四种游离的NTP按照碱基互补配对的原则合成RNA

翻译:以mRNA为模板,在核糖体内合成蛋白质的过程

特点:

模板特点原料引物DNA复制双链DNA 合成的新链与模板链一模

四种dNTP 半保留复制需要

一样

四种NTP 半不连续转录不需要转录双链DNA 合成的新链除了把DNA上

的T改为U外,其他一样

翻译mRNA 3个碱基决定一个氨基酸20种游离

的氨基酸

2.mRNA(messenger RNA,信使RNA)

信使RNA是由DNA经hnRNA剪接而成,携带遗传信息的能指导蛋白合成的一类单链核糖核酸。

3. 基因DNA分为编码区和非编码区,编码区包含外显子和内含子,一般非编码区具有基因表达的调控功能,如启动子在非编码区。编码区则转录为mRNA并最终翻译成蛋白质。

外显子和内含子都被转录到mRNA前体hnRNA中,当hnRNA进行剪接变为成熟的mRNA 时,内含子被切除,而外显子保留。实际上真正编码蛋白质的是外显子,而内含子则无编码功能,

内含子存在于DNA中,在转录的过程中,DNA上的内含子也会被转录到前体RNA中,但前体RNA上的内含子会在RNA离开细胞核进行翻译前被切除。

4.CDS Sequence coding for amino acids in protein 蛋白质编码区

CDS是Coding sequence的缩写,是编码一段蛋白产物的序列,是结构基因组学术语。

与开放读码框ORF的区别

开放读码框是从一个起始密码子开始到一个终止密码子结束的一段序列;不是所有读码框都能被表达出蛋白产物,或者能表达出占有优势或者能产生生物学功能的蛋白。CDS,是编码一段蛋白产物的序列。cds必定是一个orf。但也可能包括很多orf。反之,每个orf 不一定都是cds。Open reading frame (ORF) - a reading frame that does not contain a nucleotide triplet which stops translation before formation of a complete polypeptide. Coding sequence (CDS) - The portion of DNA that codes for transcription of messenger RNA ORF-----translation, CDS----transcription translation 是理论上的,而transcription则显然是事实存在的。

5.外显子拼接形成成熟的mRNA,多数基因都有UTR,它们也是外显子拼接的产物,所以,你会发现mRNA的长度要大于CDS,只有CDS才编码蛋白,AUG以前的mRNA编码前导序列。

外显子并不一定编码蛋白质,成熟mRNA的UTR也可以是外显子,外显子就是RNA 剪接后留下的部分

外显子与CDS区不是完全一致的,cds区一定属于外显子,但是外显子不一定是CDS区,也就是说外显子不一定都能翻译成蛋白的。

mRNA包括UTR和CDS!

内含子(intron)是断裂基因中外显子之间的间隔序列(intervening sequence,IVS),可参与前体RNA的转录,但其转录的RNA序列于转录后的加工中被切除,不包括于成熟的RNA分子中。外显子(exon)在断裂基因中,转录成熟RNA中相应序列的DNA片段。

内含子和外显子的分界线在于:GU-AG法则。即每个内含子的开始两个碱基都是是GU (或GT),最后两个是AG。

相关文档
最新文档