真核生物基因组
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
卫星DNA(satellite DNA): 其重复序列长度在5 bp ~200 bp,串联排列,通常存在 着几百万个拷贝,总长度最长可达100 Mb, 它们主要存在于异染色体以及中心粒和端粒附近,通常 不转录。
小卫星DNA(mini-satellite DNA): 重复序列长度在15~70 bp之间,串联排列,总长度在 0.5 kb ~30 kb 主要分布于常染色体,在人群中有高度的多态性(也即 有高度的特异性或拷贝的多态性)。
每种真核生物RNA聚合酶都能识别一套不同的启动子,并转 录不同类型的基因。
3种真核生物RNA聚合酶
RNA 聚合酶
RNA聚 合酶Ⅰ RNA聚 合酶Ⅱ RNA聚 合酶Ⅲ
启动子 位置
-45至 +20 上游远端 至-25 +50至 +100
启动子的 复杂性
简单
所转录 的基因
核糖体 RNA 蛋白质 编码基因 tRNA和 其他小RNA
二 重复序列
重复序列是指多拷贝的相同或近似序列的 DNA片段。 重复序列一般可以分为两类:
高度重复序列和中度重复序列 串行重复DNA和分散在整个基因组中的重复片段
1 高度重复序列:卫星DNA、小/微卫星
重复频度>105。 在真核生物基因组中,约有45%~60%的 DNA中G:C碱基对含量较高,相对浮力密度大, 将DNA打碎后,进行密度梯度超离心分离,可见 一主峰和1~2个小峰,这种小峰被看成是主峰的 卫星,称为卫星DNA,它是多种短重复序列的混 合物。 根据卫星DNA的长度,又可分成3种。
呤(A)组成的序列替换hnRNA3′端的过程,这段序列不被翻译。
可变剪切
大部分真核基因被加工成一种类型的剪接后mRNA, 约有20%的人类基因因为可变剪接而产生两种或多种 mRNA序列 有一个人类基因已被证明,相同的原始转录物可以产 生64种不同的mRNA 外显子的相互排斥: 小鼠肌钙蛋白T基因的外显子2和3是相互排斥的,外 显子2用在平滑肌中,而外显子3用于其他所有组织中 剪接装置: 由多种细胞核内小RNA和一些蛋白组成,不同的细 胞类型中可不同
微卫星DNA(micro-satellite DNA)
由2~6个核苷酸长的重复序列组成,又称为简单串联重复序列 (simple tandem repeats STRs) 以(CA)n、(GT)n、(CAG)n较常见,重复次数多为15~60次,总长 度一般在400 bp以下。 存在于常染色体,除着丝粒及端粒区域外, 微卫星DNA在染色体的 其他区域均广泛均匀分布。很随机地分布在整个基因组中,而不像卫星或 小/微卫星那样串联成簇存在 微卫星DNA在基因组中的功能尚不清楚,已知其有自身特异结合蛋 白,是一种非常活跃的碱基序列, 且能直接编码蛋白质; 另外,微卫星DNA能参与遗传物质的结构改变,染色体折叠及端粒 形成,是基因重排和变异的来源, 通过改变DNA结构或与特异性蛋白质结 合而发挥其基因调控作用。 在人类基因组中,由CA重复序列构成的微卫星如5′CACACACACACA-3′大约每1万bp出现一次,占整个基因组的0.5%(总 共15Mb),而单碱基重复(即5′-AAAAAAAA-3′)占人类基因组的0.3%
不同生物基因组内含子的特点:
在简单的真核基因组中内含子一般出现得较少(如酵 母基因组6000个基因中总共只有239个内含子 95%的人类基因至少有一个内含子,某些单个基因 中就具有100个或更多内含子
内含子在给定基因中的位置具有进化保守性,在同 源基因的序列比对中内含子经常出现在相同的位置。
3 基因的转录
非常复杂
简单
2 断裂基因--内含子和外显子
内含子(intron):已发现真核细胞中至少有8种明显不同的内
含子,但只有一种遵循GU-AG规则(GU-AG rule)的内含子与真核细胞 蛋白编码基因有关系。 GU-AG规则:所有内含子序列5’端起始的两个核苷酸总是5’-GU-3’,而 3’端的最后两个碱基总是5’-AG-3’ 。
Alternative splicing With a few genes, alternative splicing generates more than one mRNA from the primary transcript. Exons, or parts of exons, may be skipped.
一
真核生物基因结构
1 启动子元件 开放阅读框标志:
由于大量内含子的存在,真核生物中没有发现原核生物具有的 显著长度的开放阅读框标志。
RNA聚合酶种类:
与原核生物只使用一种由多种蛋白质聚合而成的RNA聚合酶不 同,真核生物至少使用由8~12种蛋白质组成的3种不同类型的RNA 聚合酶。
启动子元件多样性:
内含子和外显子的长度:
内含子至少长60bp; 在脊椎动物中外显子长度的变化范围也很广,于100- 2000bp之间,常见的长约450bp。
Eukaryotic Gene
真核基因的内含子/外显子结构和对应的hmRNA转录物经过加工后的mRNA: (a)显示了与酵母内含子的5′和3′剪接位点相关联的保守序列。每个核苷酸旁的 下标数字表示该核苷酸在所有已知酵母基因内含子中的出现频率。 (b)剪接体通过配对识别剪接位点,从而产生mRNA以供核糖体翻译之用。
Alternative Splicing
Basic Mechanism
Repressor stops splicing that would otherwise occur Repressor
Activator initiates splicing that otherwise wouldn’t occur Activator
果蝇肌球蛋白重链转录体,在不同发育阶段有三种不同表达产物。 相同的降钙素基因相关肽(calcitonin gene related peptide)原始转 录体,在甲状腺、脑等不同组织细胞内,因剪接方式不同使其表达产 物不同。 不同B细胞的免疫球蛋白原始转录体都是相同的
4 转录后加工--加帽、剪接和加尾:
RNA聚合酶Ⅱ转录物在加工前称为hnRNA(异质RNA), 通过加帽(capping)、剪接和多聚腺苷酸化转化成适合 核糖体翻译的mRNA。 加帽(capping)--是指所有发生在hnRNA5′末端的化学改变
(包括Baidu Nhomakorabea基化作用)
剪接(splicing)--从hnRNA中大批地精确切除大片段的过程 多聚腺酸化(polyadenylation)--指用一段大约由250个腺嘌
真核mRNA原始转录体(primary transcripts): 1. 简单原始转录体--经剪接仅生成一条成熟mRNA和翻译 出一条多肽链 2. 复杂原始转录体--在不同的时(不同发育阶段)空(不 同组织细胞),同一原始转录体因转录起点、剪接方式或 终止点的不同,可产生两种或多种成熟mRNA和多肽链。 例如