02 第二章 人类基因
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)短分散元件 人类的 Alu 家族(Alu Family),占人类
基因组的 3%-6%,由 300 bp 构成,在第 170 位附近都有 AGCT 顺序 被内切酶 AluI 所切割 ( AG↓CT ),故而得名。 这些顺序在基因中的重复次数可以达到 30万- 50万次,平均 5kb DNA 就有一个Alu 顺序。
线粒体基因组 =16.6 kb
~70%~80%
~20%~30%
编码
DAN
假基因
wenku.baidu.com
DNA 片断
内含子非 翻译顺序
串联重复顺序/ 串联重复顺序 或成簇重复顺序
细胞核基因组的简单介绍
每条染色体含1个DNA分子,1个细胞的全 部遗传信息(基因)都编码在线状的DNA分子上。 由于每个体细胞中有2套染色体(2n),故所含的 DNA是由两个基因组(genome)构成。每个单倍 体基因组约含3.2×109bp。人类基因的平均长度为 1-1.5kb,所以基因组以足以编码1.5×106蛋白质, 但实际上编码蛋白质的结构基因只不过5万-10万个, 仅占总基因组的2%-3%。
多 A/T
发夹状结构
5’
AUU
UUUUU
3’
2 . 中度重复顺序
Moderately Repetitive Sequence
中度重复顺序的长度在 300-7000 bp 之间,拷贝数在 102 - 105 。中度重复顺 序一般不是编码顺序。据认为在基因中起 着重要的调控作用,包括开启和关闭基因, 促进和终止转录,DNA 复制的起始,参与 mRNA 的加工等。
3’
1 . 启动子
A A 1) (1) TATA box : TATA T A T 位于转录起始点得上游-30~50 bp 。位于转录起始点得上游-
处。他决定转录起始点,是RNA聚合酶的结合位点之一。 他决定转录起始点, 聚合酶的结合位点之一。 聚合酶的结合位点之一 C ) , (2) CAAT box : GG CAATCT, 位于转录起始点的上游 T 也是RNA聚合酶得结合位点之一。控制着转 聚合酶得结合位点之一。 -80 ~100 bp 处,也是 聚合酶得结合位点之一 录起始的频率。 录起始的频率。 有两个拷贝,位于CAAT box 的两侧,由 GGCGGG 的两侧, (3) GC box : 有两个拷贝,位于 ) 组成,是一个转录调节区,有激活转录得功能。 组成,是一个转录调节区,有激活转录得功能。 包括以下几种顺序冷促进转录得进行。 启动子 ( Promoter )包括以下几种顺序冷促进转录得进行。
YAC在两种细胞分裂过程中(有丝分裂 和减数分裂)都是稳定的,并且被证明作为 人类基因组计划的一部分,作为装配重叠 DNA克隆的工作载体有无法估量的价值。也 是定义和剖析功能元件(例如端粒和着丝粒) 在酵母染色体正常行为中重要作用的关键。
若没有功能性的着丝粒,人造染色体是 不稳定的,无法与纺锤丝连接,所以结构很 快瓦解。因此,许多研究者试图确定着丝粒 中在细胞分裂过程里正常工作的序列成分。 至少有三个研究团体已经证明了大量卫星DNA 与稳定地进行有丝分裂,与拥有完整功能的 着丝粒(在一些例子中,是完全功能的端粒) 的人造染色体的形成有关 。
(2)长分散元件 Kpn l 家族 ( Knpnl Family ), 被内切酶 Kpn l 所切割约占基因组的 3%-6% , 由 3000 ~ 4000 bp 个拷贝 组成,其功能不详。
3. 基因家族 和 基因簇
( Gene Family; Gene Cluster ) 基因家族: 基因家族: 真核生物基因组中有许多
其余的DNA顺序包括基因之间的间隔顺序、 基因内插入顺序、重复顺序等。目前,对它们的 功能知之甚少,绝大多数重复顺序只不过是过剩 的DNA。但是,其中一些则有着特殊的功能, 包括:调节基因的表达,增强同源染色体之间的 配对和重组,维持染色体结构,调节前mRNA的 加工以及参与DNA的复制等。
(二)重复顺序
2 . 增强子
增强子 ( Enhancer ) 位于真核基因转录起始 点的上游或者下游,它不能启动一个基因的转录, 但是有增强转录的功能,此外,增强子顺序还可 以与特异性细胞因子结合而促进转录。 研究表明,增强子通常有组织特异性,这是 因为不同的细胞核有不同的特异因子于增强结合。 从而对基因得表达有组织、器官、时间不同的调 节作用。
来源相同,结构相似,功能相关的基因,称 为基因家族 ( gene family )。基因家族中 的成员可以分布于几条不同的染色体上,也 可以集中在一条染色体上。
基因簇:集中成簇的基因称为基因簇 ( gene cluster ),它们位于同一染色体上 的同一位点。组蛋白基因簇则集群于 7q32-q36。
关于假基因的最新资料
假基因与内含子、卫星序列、转位因子等一样, 假基因与内含子、卫星序列、转位因子等一样,是冗余 DNA ,从这个意义上说,假基因是功能基因的“弃儿”。但 从这个意义上说,假基因是功能基因的“弃儿” 正是这些看似无用的遗传变异为物种进化提供了丰富的原材 料,从而成为物种进化不可或缺的有用“工具”。 从而成为物种进化不可或缺的有用“工具” 随着人类基因组计划的顺利实施,人们分离、 随着人类基因组计划的顺利实施,人们分离、鉴定新基 因的速度越来越快,对于占人类基因组97%的非表达序列的 因的速度越来越快,对于占人类基因组97%的非表达序列的 研究(只有约3%的人类基因组是由外显子序列组成的),即 研究(只有约 的人类基因组是由外显子序列组成的),即 的人类基因组是由外显子序列组成的), 对所谓“垃圾 的研究正逐步展开, 对所谓“垃圾DNA”的研究正逐步展开,它们在进化方面的作 的研究正逐步展开 用已经得到肯定, 用已经得到肯定,其中对假基因分类中的主移动元件 的研究已成为当今的研究“ (master mobile element)L1的研究已成为当今的研究“热 ) 的研究已成为当今的研究 例导致人类疾病。 点”。到目前为止,共发现8例导致人类疾病。 到目前为止,共发现 例导致人类疾病
反向重复顺序 5’ 3’ A T T A A A G G C T C C T T T T G G A G C C T T T T T T T T 3’ T A A T T T C C G A G G A A AAC C T C G G A A A A A A A 5’
模板链
多 G/C
U U U U C·G C·G U·A C·G G·C G·C A· U A· U A· U
1 . 高度重复顺序 ( Highly Repetitive Sequence ) 2 . 中度重复顺序 ( Moderately Repetitive Sequence )
1 . 高度重复顺序
重复顺序的长度可以是 2、4、6、8 等几个 bp , 较长的顺序可以达到 200
bp , 但是重复的拷贝次数可以达到 106 以上。
(2)小卫星 DNA 和微卫星DNA 和微卫星DNA
在人类基因组存在着许多串联排 列的DNA序列。6-25个核苷酸串联重 复序列称小卫星DNA;2-6个核苷酸串 联重复序列称微卫星DNA。
(3)反向重复序列
DNA某些部位具有方向相反但序列相同的区 域,有两种情况: 两条互补序列在一条DNA链上反向平排列; 两条互补序列隔着一段间隔序列。
第二节 基因的化学本质
DNA RNA
第三节 人类基因和基 因组的结构特点
一、染色体的分子组成 二、真核基因的分子结构特点
一、染色体的分子组成
单一顺序( (一) 单一顺序( unique sequence ) (二) 重复顺序( repetitive sequence ) 重复顺序( 多基因家族( (三) 多基因家族( multigene family ) (四) 假基因 ( pseudogene )
(一)单一顺序 单一顺序约占基因组的 60% ~ 65% 。 这种顺序在基因组中一般仅有单个和几 个拷贝,大多数编码蛋白质和酶的基因 属于此类基因。 单一顺序还以间隔顺序和散在分布 的重复顺序构成侧翼。
人类基因组
细胞核基因组 =30000 Mb ~20% 基因和基因 有关顺序 单一或中等 重复顺序 <10% >90% 非编码 DNA 单一的或低 拷贝数顺序 中度至高度重复顺序 ~60% ~40% 散在重 复顺序 ~80% 基因外 DNA 2 个 rRNA 基因 22 个 tRNA 基因 13 个蛋白 编码基因
第二章 人类基因
第一节 基因的基本概念 第二节 基因的化学本质 第三节 人类基因和基因 组的结构特点
第一节 基因的基本概念
孟德尔的遗传因子 摩尔根的基因 一个基因一种蛋白质 一个基因一条多肽链 基因一定编码蛋白质的氨基酸种类和顺序吗? 基因一定要被转录吗?
现代基因的概念
基因是具有特定功能的DNA片段。 片段。 基因是具有特定功能的 片段 形状的改变一定要有基因的改变吗? 形状的改变一定要有基因的改变吗? 表观遗传学 调控基因的改变 基因的修饰
二、真核基因的分子结构特点
编码区: 编码区:外显子和内含子 启动子 非编码区: 非编码区:侧翼顺序 增强子 终止子
En P3 P2 P3
转录起始点 P1 E1 GT
I1 AG
E2 GT
I2 AG
终止密码 E3
5’
5‘UT 起始密码 3’UT AATAAA
3’
Intron) (一)外显子和内含子(Exon and Intron) 外显子和内含子(
外显子:在结构基因中编码氨基酸的顺序的 DNA 外显子 片断 。 内含子:在结构基因中不编码氨基酸顺序的 DNA 内含子 片断。内含子又称为插入顺序 ( Intervening Sequence, IVS )。
真核生物中也有些结构基因没有内含子的。如组 蛋白基因、干扰素基因等。它们大多数都是以基因簇 的形式出现,大多数的酵母结构基因也没有内含子。 内含子在转录出 mRNA 后被剪切掉。 真核生物有内含子,将编码顺序隔开,所以,真 核生物的基因是不连续的基因,又把真核生物的基因 称为 断裂基因(Interrupted Discontinuous Gene)。
在第一个外显子和最后一个外显子的 外侧是一段不被翻译得非编码区,成为侧 翼顺序 ( Flanking Sequence ) ,侧翼 顺序含有基因的调控顺序,包括启动子、 增强子、终止子等。
En
P3 P2 P3
转录起始点 P1 E1 GT
I1 AG
E2 GT
I2 AG
终止密码 E3
5’
5‘UT 起始密码 3’UT AATAAA
外显子与内含子接头
每个外显子和内含子接头区都有一段高度保 守的一致顺序 ( Consensus Sequence ) ,即内 含子 5’ 末端大多数是 GT 开始,3’ 末端大多数 是 AG 结束。 称为 GT—AG 法则,这是普遍
存在于真核基因中 RNA 剪接得识别信号。
GT
AG
GT
AG
(二)侧翼顺序
( 1 )卫星 DNA
染色体的着丝粒、端粒和 Y 染色体长 臂上的异染区,就是高度重复顺序的卫星 DNA ( Satellite DNA ) 构成的高度重复顺 序不能转录,它们参与染色体结构的维持, 形成结构基因的间隔, 可能与减数分裂中 同源染色体的联会配对有关。
80年代初,人造染色体就诞生了,利用酵 母的各组成部分构建出具有完整功能的酵母染 色体。酵母人造染色体(YAC)能由克隆端粒 (染色体末端的特殊DNA序列),着丝粒(保证 细胞的分裂)和带有DNA复制起点的基因组片断 (DNA合成能沿着染色体DNA的某个位点正确地 开始)组装而成。
基因家族:基因家族的成员并不是集群排列 成为基因簇,而是散布在基因组中的不同位置,但 编码一组功能紧密相关的蛋白质。人类的类 α、β 珠蛋白基因簇分别串联排列与 16p13 和 11p15 上。
4. 假基因 ( Pseudogene )
在基因家族中的某些成员不产生有功能的基 因产物,这类基因称为假基因 ( pseudogene ), 例如,珠蛋白基因簇中的 ψ α。假基因最初也 是有功能的,后来由于缺失、倒位、或者是点突 变等原因使这些基因成为没有功能的基因。 假 基因可以与有功能的基因连锁,散在分布于有功 能基因中间。