第五章 真核生物基因组结构
第五章真核生物基因组结构

外显子:具有编码意义
结
转录单位
内含子:无编码意义( 5′GT、
构
基 因
非编码区
3′AG;GT -AG法则) TATA框 前导区 启动子 CAAT框 尾部区 增强子 GC框:调节转录活动。 调控 区 mRNA裂解信号 终止子 回文结构
00:28
21
Interrupted gene
00:28
43
核小体的结构组成
每个核小体含有约200bp的DNA,核心
组蛋白H2A、H2B、H3和H4各2份拷贝, 1份拷贝的H1组蛋白位于核小体外侧。
微球菌核酸酶(micrococcal nuclease) 处理染色体可得到单个核小体。
00:28 44
八聚体 染色质小体 (~166bp) 核小体 (~200bp) DNA 连接区 (常为 32~34bp) 图 10-10 核小体的组成 DNA H1
28
内含子(Intron)
选择性剪接:同一基因的转录产物
由于不同的剪接方式形成不同mRNA。
00:28
29
PS DNA
外显子 S
PL外显子 L来自外显子 2外显子 3
50b
2800bp
161bp
4500bp
205bp 327bp
初始转录本: 在唾腺中转录 成熟 mRNA: 1663nt 初始转录本: 在肝中转录 成熟 mRNA: 1773nt 图 18-57 小鼠淀粉酶(amy) 基因利用不同启动子产生两个不同的 mRNA
00:28
染色体( 1400nm,2个染色单体, 每个染 色体单体含10个螺旋圈)
51
染色质和染色体的概念
染色质(chromatin):是指细胞周期间期细胞核内由 因其易被碱性染料染色而得名。
真核基因结构

真核基因结构基因,是生命的密码,承载着生物体生长、发育、繁殖等一系列重要信息。
在真核生物中,基因的结构具有独特而复杂的特点。
真核基因一般由编码区和非编码区两大部分组成。
编码区是基因中能够转录并翻译成蛋白质的区域,而非编码区虽然不直接参与蛋白质的合成,但对基因的表达调控起着至关重要的作用。
编码区包含外显子和内含子。
外显子是最终会出现在成熟 mRNA 中的片段,并被翻译成蛋白质的氨基酸序列。
内含子则位于外显子之间,在转录后的加工过程中会被剪切掉。
这种“剪接”机制增加了基因表达的多样性和复杂性。
比如说,一个基因通过不同的剪接方式,可以产生多种不同的 mRNA ,进而翻译成不同的蛋白质,实现了“一种基因,多种蛋白质”的奇妙效果。
非编码区也有着丰富的组成成分。
启动子位于基因的上游,是RNA 聚合酶结合的部位,决定了基因转录的起始位点和频率。
增强子能够增强基因的转录活性,即使它们距离基因的编码区较远,也能发挥作用。
还有沉默子,其功能与增强子相反,能够抑制基因的转录。
真核基因的 DNA 还会与组蛋白等蛋白质结合,形成染色质。
染色质的结构会影响基因的表达。
在紧密压缩的染色质状态下,基因难以被转录;而在较为松散的状态下,基因更容易被转录。
这就好像是把基因“藏”在不同紧密程度的“柜子”里,决定了它们什么时候能“露面”发挥作用。
真核基因的转录过程也比原核生物更为复杂。
首先,RNA 聚合酶需要结合到启动子上,然后开始沿着DNA 链移动,合成前体mRNA 。
在前体 mRNA 合成后,还需要经过一系列的加工,如 5'端加帽、3'端加尾以及内含子的剪接等,才能成为成熟的 mRNA 。
成熟的 mRNA 会从细胞核转移到细胞质中,与核糖体结合进行翻译,合成蛋白质。
在翻译过程中,遗传密码子决定了氨基酸的排列顺序,从而形成具有特定结构和功能的蛋白质。
真核基因的结构和表达调控机制是一个精妙而复杂的系统。
这使得真核生物能够在不同的环境条件和发育阶段,精确地调节基因的表达,从而适应复杂多变的生存环境。
真核生物的基因组结构与功能分析

真核生物的基因组结构与功能分析真核生物是指在生命进化过程中逐渐形成的一类生物,其基本特征之一是存在真核细胞核。
真核生物的基因组结构较为复杂,包含多个线性染色体和一些质粒。
对基因组结构的分析与理解,对于揭示其生物功能和进化机制是至关重要的。
一、真核生物的基因组结构真核生物的基因组大小较大,同一物种不同个体之间的基因组大小存在较大的差异。
基因组大小与细胞大小和复杂度之间存在着类似关联性。
人类基因组大小约为3亿个碱基对,其中蛋白编码基因仅占大约2%。
真核生物的基因组在基本结构上与细菌大相径庭,主要包括以下几个方面。
1. 染色体染色体是真核生物中最重要、最基本的遗传物质,是基因在生物体内的物质传递介质,是遗传信息的载体。
在精细结构上,真核细胞中存在很多复杂的染色体结构,如核小体、类固醇激素受体、平衡染色体等。
2. 基因组复制真核生物的基因组复制主要包括原核生物和真核生物的不同模式,其中原核生物中存在着DNA单线复制机制,而真核生物则采用DNA复制机器进行自我复制。
与原核生物不同的是,真核生物的DNA复制机器必须满足染色体的线性特性和复杂的三维结构,包括多个酶和蛋白质。
3. 基因只读基因只读是指通过读取基因组中的基因序列,进而达到生物高效功能表达和调节的过程。
真核生物基因组的序列阅读具有高度异质性,不同物种、不同个体之间存在大量的序列差异,这在一定程度上阻碍了对真核生物的功能研究。
二、真核生物的基因组功能分析真核生物的基因组分析主要包括以下几个方面。
1. 蛋白编码基因预测蛋白编码基因是真核生物基因组的重要组成部分,对真核生物的基因组进行蛋白编码基因预测,可以揭示其生物功能和进化机制。
目前,已经建立了多种基于序列、结构、相对位置等的蛋白编码基因预测算法与工具,如Glimmer、InterProScan、Pfam等。
2. 生物信息分析真核生物的基因组分析需要大量的计算资源和分析工具,这就需要借助生物信息学的手段来实现。
真核细胞的基因结构

真核细胞的基因结构在遗传学上通常将能编码蛋白质的基因称为结构基因。
真核生物的结构基因是断裂的基因。
一个断裂基因能够含有若干段编码序列,这些可以编码的序列称为外显子。
在两个外显子之间被一段不编码的间隔序列隔开,这些间隔序列称为内含子。
每个断裂基因在第一个和最后一个外显子的外侧各有一段非编码区,有人称其为侧翼序列。
在侧翼序列上有一系列调控序列(图1)。
调控序列主要有以下几种:①在5′端转录起始点上游约20~30个核苷酸的地方,有TATA框(TATA box)。
TA TA框是一个短的核苷酸序列,其碱基顺序为TATAA TAAT。
TA TA 框是启动子中的一个顺序,它是RNA聚合酶的重要的接触点,它能够使酶准确地识别转录的起始点并开始转录。
当TA TA框中的碱基顺序有所改变时,mRNA的转录就会从不正常的位置开始。
②在5′端转录起始点上游约70~80个核苷酸的地方,有CAAT框(CAAT box)。
CAAT框是启动子中另一个短的核苷酸序列,其碱基顺序为GGCTCAATCT。
CAAT框是RNA聚合酶的另一个结合点,它的作用还不很肯定,但一般认为它控制着转录的起始频率,而不影响转录的起始点。
当这段顺序被改变后,mRNA的形成量会明显减少。
③在5′端转录起始点上游约100个核苷酸以远的位置,有些顺序可以起到增强转录活性的作用,它能使转录活性增强上百倍,因此被称为增强子。
当这些顺序不存在时,可大大降低转录水平。
研究表明,增强子通常有组织特异性,这是因为不同细胞核有不同的特异因子与增强子结合,从而对不同组织、器官的基因表达有不同的调控作用。
例如,人类胰岛素基因5′末端上游约250个核苷酸处有一组织特异性增强子,在胰岛素β细胞中有一种特异性蛋白因子,可以作用于这个区域以增强胰岛素基因的转录。
在其他组织细胞中没有这种蛋白因子,所以也就没有此作用。
这就是为什么胰岛素基因只有在胰岛素β细胞中才能很好表达的重要原因。
④在3′端终止密码的下游有一个核苷酸顺序为AATAAA,这一顺序可能对mRNA的加尾(mRNA尾部添加多聚A)有重要作用。
真核细胞基因组结构与功能

非组蛋白功能
1. 参与并调控基因表达
参与基因复制、转录及核酸修饰的酶类(如各种 DNA 和 RNA聚合酶等) 参与转录调控的蛋白质
2. 维持染色体的高级结构
非组蛋白中的核基质蛋白对于维持染色体的高级结构 是必不可少的
21
从DNA到染色体的四级结构模型
一级结构:核小体串珠结构 二级结构:螺线管
30
核小体串珠状模型
31
染色体的包装 ——超螺旋结构
螺线管纤维(solenoidal fiber) ——染色体DNA二级包装 由6个核小体盘绕形成一种中空螺线管,其外 径为30 nm,因此,螺线管的形成使DNA一级 包装又压缩小6倍 若以充分伸展的DNA双螺旋论,每个螺线管包 含了408 nm(6×68 nm)长度的DNA链,而 每圈螺线管的长度几乎等于核小体直径,即 11nm,故染色体的二级包装相当于将DNA长 32 度压缩了近40倍
氨基酸 残基数
215 129
分子量 23,000 13,960
H1
H 2A
H 2B
H3 H4
16 10
11
6 13
14
13 13
10
1.7 1.8
2.5
125 135
102
13,774 15,342
11,282
16
富 Arg
组蛋白
组蛋白的等电点(pI)在7.5-10.5之间,所含的强极性 氨基酸使组蛋白带上大量电荷,成为组蛋白与DNA结合 及蛋白质之间的相互作用的主要化学力之一
34
染色体的包装——超螺旋结构
三级包装后,DNA链被压缩的程度仍远远不足 以形成能被细胞核容纳的染色体,因此,环状 螺线管纤维需进一步包装
简述高等真核生物基因组序列组成

简述高等真核生物基因组序列组成
高等真核生物的基因组序列由 DNA 组成,其中包含两万到五万个基因,这些基因控制着细胞的生长、分化、代谢等生物学过程。
基因组序列由 DNA 分子组成,DNA 分子由核苷酸组成,核苷酸由碱基构成。
碱基包括腺嘌呤 (A)、鸟嘌呤 (G)、胞嘧啶 (C) 和胸腺嘧啶 (T)。
基因组序列还包括基因序列、非编码 DNA 序列以及转录因子结合位点等。
基因是基因组序列中的重要组成部分,控制着细胞的生长、分化、代谢等生物学过程。
每个基因由一个或多个基因单元组成,基因单元包括编码区、非编码区和调控区等。
编码区包含了基因的氨基酸序列,决定了蛋白质的结构和功能。
非编码区包括启动子、增强子、终止子等区域,可以影响基因的表达。
调控区可以控制基因的转录和翻译。
除了基因序列外,高等真核生物的基因组序列还包括非编码 DNA 序列。
这些序列包括转录因子结合位点、反转录转座子、插入序列等。
转录因子结合位点可以影响基因的表达,反转录转座子可以插入到基因组序列中,影响基因的结构和功能,插入序列则可以影响基因组的结构和稳定性。
高等真核生物的基因组序列非常复杂,包含了大量的基因、非编码 DNA 序列和调控区域。
对这些序列的研究可以为疾病诊断和治疗、基因编辑、生物合成等提供重要线索。
真核基因组结构

15.3 Composite transposons have IS modules
Figure 15.2 A composite transposon has a central region carrying markers (such as drug resistance) flanked by IS modules. The modules have short inverted terminal repeats. If the modules themselves are in inverted orientation (as drawn), the short inverted terminal repeats at the ends of the transposon are identical.
微卫星DNA:总长度小于150bp,分布在所 有染色体,重复单位为1-5bp,重复次数1060次,常见的是 (AC)n (TG)n
4.9 Satellite DNAs often lie in heterochromatin Figure 4.14 Mouse DNA is separated into a main band and a satellite by centrifugation through a density gradient of CsCl.
4.9 Satellite DNAs often lie in heterochromatin
Figure 4.15 Cytological hybridization shows that mouse satellite DNA is located at the centromeres. Photograph kindly provided by Mary Lou Pardue and Joe Gall.
真核生物基因组结构

三、真核生物基因组的非重复序列和重复序列
1.DNA复性动力学 2.DNA的复性过程遵循二级反响动力学。
DNA复性过程中复性的速度用公式表示:
dC/dt= -kC02
其中,C是单链DNA在t时刻的浓度。
k=复性速度常数
对上式积分后重排,得出复性动力学方程: C/C0=1/〔1+ k C0t〕
C0为单链DNA的起始浓度,C为单链DNA在t时刻的浓 度,单位mol/L。 t为复性时间,单位为s〔秒〕。重组速率常 数k的单位为L/mol,取决于阳离子的浓度、温度、片段大小 和DNA序列的复杂性。
植物 鸟类 哺乳动物 爬行动物 两栖动物 硬骨鱼 软骨鱼 棘皮动物 甲壳动物 昆虫 软体动物 蠕虫 霉菌 藻类 真菌 格兰氏阳性菌 格兰氏阴性菌 支原体
阴影局部为一个门内C-值的范围
二、真核生物基因组的基因数量
不同物种编码基因差异很大,从500个到50000 个,有100倍的差距。
真核生物的基因数量通常在6000到50000之间。 人的基因组的全长为大约3 X 109对碱基,编码 3-4万个基因; 但某些寄生的真核生物,如脑微孢子虫,基因数 量可能不超过3000个,比很多细菌的基因数量还少。
当 C/ C0 = 1/2 时的C0t值定义为C0t1即/2复性反响 完成一半时
C / C0 = 1/2 = 1 / (1+ k
C0t(1/2))
Cot(1/2) = 1/k (mol. Sec / L)
DNA复性的影响因素:
DNA序列的复杂性、初始浓度、片段大小、温度、离子强度
在控制反响条件〔初始浓度、温度、离子强度、片段大 小〕一样的前提下,DNA分子的C0t (1/2)值,取决于 核苷酸的排列复杂性。
简述真核生物基因的结构特点

简述真核生物基因的结构特点真核生物基因的结构特点包括以下几个方面:1. 真核生物基因位于染色体上,是真核生物细胞中的核心结构。
染色体是由 DNA 和蛋白质组成的复合物,是在细胞分裂时传递遗传信息的基本单位。
真核生物基因组的 DNA 与蛋白质结合形成染色体,储存于细胞核内。
除配子细胞外,体细胞内的基因组是双份的 (即双倍体,diploid),即有两份同源的基因组。
2. 真核细胞基因转录产物为单顺反子 (monocistron),即一个结构基因转录、翻译成一个 mRNA 分子,一条多肽链。
真核生物的基因转录是在 DNA 模板上以 RNA 为模板进行转录,产生的 mRNA 是单链,在细胞质中由核糖体(ribosome) 进行翻译。
3. 真核生物基因组中存在大量重复序列,包括高度重复序列和中度重复序列。
高度重复序列重复频率可达 106 次,包括卫星 DNA、反向重复序列和较复杂的重复单位组成的重复序列;中度重复序列可达 103~104 次,如为数众多的Alu 家族序列,KpnI 家族,Hinf 家族序列,以及一些编码区序列如 rRNA 基因、tRNA 基因、组蛋白基因等。
4. 真核生物基因是不连续的,在真核生物结构基因的内部存在许多不编码蛋白质的间隔序列 (interveningsequences),称为内含子 (intron),编码区则称为外显子 (exon)。
内含子与外显子相间排列,转录时一起被转录下来,然后RNA 中的内含子被切掉,外显子连接在一起成为成熟的 mRNA,作为指导蛋白质合成的模板。
5. 真核生物基因组远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。
真核生物基因组 DNA 与蛋白质结合形成染色体,储存于细胞核内。
除配子细胞外,体细胞内的基因组是双份的 (即双倍体,diploid),即有两份同源的基因组。
阐述真核生物基因组结构特点

真核生物是一类拥有真正的细胞核的生物。
它们的基因组结构与原核生物不同,具有以下几个特点:1.基因组大小不一:真核生物的基因组大小不一,从数百万到数十亿个碱基对不等。
这是因为真核生物的基因组中不仅包含编码蛋白质的基因,还包含其他功能基因,如调控基因、功能未知基因等。
2.基因组有组织结构:真核生物的基因组呈现出组织结构,分布在染色体上。
染色体是由DNA 和蛋白质构成的,在细胞核内进行染色体分离和细胞分裂过程中发挥重要作用。
3.基因组中含有多种基因:真核生物的基因组中含有多种基因,包括编码蛋白质的基因、调控基因、功能未知基因等。
这些基因在基因组中的分布不均匀,有的集中在染色体的某些区域,有的分布在整个基因组的各个部分。
4.基因组中含有冗余信息:真核生物的基因组中含有大量冗余信息,即同一基因的多个副本。
这是因为真核生物的基因组经常经历染色体重组,使得同一基因的多个副本分布在染色体的不同位置,从而增加了基因组的冗余度。
冗余信息在基因组的稳定性中起着重要作用,可以在基因组遭受损伤时提供替代品。
5.基因组中含有跨基因区:真核生物的基因组中含有跨基因区,即与编码蛋白质无关的DNA 序列。
这些序列可能具有调控基因表达的功能,也可能是遗传信息的载体。
跨基因区在基因组的结构和功能中发挥着重要作用。
总的来说,真核生物的基因组结构具有复杂性和多样性,与原核生物相比具有较大的差异。
这些差异决定了真核生物的生物学特征,如多倍体、染色体分离、细胞分裂、发育等。
研究真核生物的基因组结构,不仅有助于我们了解真核生物的生物学特征,还能为我们提供重要的基础知识,帮助我们解决生物学问题。
第五章真核生物基因组结构

内含子(Intron)
特点
1.不具有序列特异性 2.保守性 3.决定基因的长度 4.相对性
内含子(Intron)
选择性剪接:同一基因的转录产物
由于不同的剪接方式形成不同mRNA 。
PS
DNA
初始转录本: 在唾腺中转录
外显子 S
PL 外显子 L
外显子 2 外显子 3
50b 2800bp
161bp 4500bp 205bp 327bp
五、染色体
染色体结构与类型:
染色单体
随体
着丝点
短臂
长臂
中着丝粒 染色体
亚中着丝粒 染色体
近端着丝粒 染色体
端着丝粒 染色体
着丝粒(又叫主缢痕)是染色体最显著的 特征,碱性染料着色浅,且表现缢缩,它 将染色体分成两个臂(长臂-q和短臂- p)。 功能:
①把两个姐妹染色单体结合在一起。
②是纺锤丝附着于染色体的位点
染 色 质 小 体
(~ 166bp)
146bp
DNA 166bp
H1
20bp
DNA连 接 区
(常 为32~ 34bp)
核 心 颗 粒
图10-10 核 小 体 的 组 成
二、染色质的高级结构模型
DNA链(缩短7倍)→核小体(缩短6倍)→螺 线管(缩短40倍)→超级螺线管(缩短5倍) →染色体
从染色质到染色体
① 在真核细胞中,一条成熟的mRNA链只能翻译 出一条多肽链,很少存在原核生物中常见的多 基因操纵子形式。
② 真核细胞DNA与组蛋白和大量非组蛋白相结 合,只有一小部分DNA是裸露的。
③ 高等真核细胞DNA中很大部分是不转录的,大部 分真核细胞的基因中间还存在不被翻译的内含子。
简述真核生物基因组的结构特点。

简述真核生物基因组的结构特点。
真核生物基因组的结构特点可以总结为以下几个方面:
1. 基因组大小:真核生物基因组通常比原核生物基因组大得多。
这是因为真核生物具有更复杂的细胞结构和功能,需要更多的基因来编码这些复杂的生物过程。
例如,人类基因组约有3.2亿个碱基对,而大肠杆菌的基因组只有约4.6百万个碱基对。
2. 编码区和非编码区:真核生物基因组中的编码区域指的是能够转录成RNA和编码蛋白质的区域,约占整个基因组的2%左右。
而非编码区域则包括转录调控
元素、间隔区和反义链等。
真核生物基因组中的非编码区域通常比编码区域更大,这些区域在基因的表达调控、染色体结构和稳定性等方面起着重要的作用。
3. 基因的排列方式:真核生物基因组中的基因通常呈现出分散排列的模式,即基因之间有大量的非编码区域。
这与原核生物的连续基因排列方式有所不同。
分散排列的基因组结构使得真核生物基因的表达能够更加灵活,有利于调控基因的表达。
4. 基因的剪接变异:真核生物基因组中的大多数基因存在剪接变异。
剪接是指在转录后的RNA分子中去除部分非编码区域,并将编码区域连接起来形成成熟的mRNA分子。
这种剪接变异使得一个基因可以编码多种不同的蛋白质,增加了基
因组的复杂性和多样性。
总体而言,真核生物基因组具有相对复杂的结构特点,包括基因组大小、编码区和非编码区的比例、基因的排列方式和剪接变异等。
这些结构特点为真核生物提供了更高级的基因调控和表达方式,使其能够适应复杂的生物功能和环境变化。
真核生物染色体基因组的结构和功能

真核生物染色体基因组的结构和功能∙真核生物基因组特点∙高度重复序列o反向重复序列o卫星DNAo较复杂的重复单位组成的重复顺序o高度重复序列的功能∙中度重复顺序o Alu家族o KpnⅠ家族o Hinf家族o rRNA基因o多聚dT-dG家族o组蛋白基因∙单拷贝顺序(低度重复顺序)∙多基因家族与假基因∙自私DNA(selfish DNA)真核生物的基因组一般比较庞大,例如人的单倍体基因组由3×106 bp硷基组成,按1000个碱基编码一种蛋白质计,理论上可有300万个基因。
但实际上,人细胞中所含基因总数大概会超过10万个。
这就说明在人细胞基因组中有许多DNA序列并不转录成mRNA用于指导蛋白质的合成。
DNA的复性动力学研究发现这些非编码区往往都是一些大量的重复序列,这些重复序列或集中成簇,或分散在基因之间。
在基因内部也有许多能转录但不翻译的间隔序列(内含子)。
因此,在人细胞的整个基因组当中只有很少一部份(约占2-3%)的DNA 序列用以编码蛋白质。
真核生物基因组有以下特点。
1.真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即双倍体,diploid),即有两份同源的基因组。
2.真核细胞基因转录产物为单顺反子。
一个结构基因经过转录和翻译生成一个mRNA 分子和一条多肽链。
3.存在重复序列,重复次数可达百万次以上。
4.基因组中不编码的区域多于编码区域。
5.大部分基因含有内含子,因此,基因是不连续的。
6.基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。
高度重复序列:高度重复序列在基因组中重复频率高,可达百万(106)以上,因此复性速度很快。
在基因组中所占比例随种属而异,约占10-60%,在人基因组中约占20%。
高度重复顺序又按其结构特点分为三种。
(1)倒位(反向)重复序列这种重复顺序复性速度极快,即使在极稀的DNA浓度下,也能很快复性,因此又称零时复性部分,约占人基因组的5%。
真核生物基因组结构与功能研究

真核生物基因组结构与功能研究真核生物是指一类具有明确细胞结构,细胞包含细胞核的生物。
真核生物基因组是真核细胞中遗传信息的载体,是真核生物重要的研究对象之一。
随着科技的发展,人类对真核生物基因组结构和功能的研究不断深入,相关的研究发展出了许多细分的领域。
一、基因组结构1、基因组大小基因组的大小一般是指DNA的分子量或核苷酸对数,一种真核生物的基因组大小可以与另一种相差数千倍。
例如,两倍体的人类基因组大小约为6.6亿个核苷酸对数,而绿藻的基因组大小约为12,000个核苷酸对数。
基因组大小的不同与个体的进化、物种分化有关。
2、染色质结构真核生物表现出一定的染色质层次结构。
在细胞增殖中,染色质可在溶胶冷冻技术的帮助下得到“锥形积累”形态,这种结构能够精确地显示出染色质所含DNA的分子量大小和相对含量。
基于此,科学家们得以初步探究出细胞核及其内部核仁的自然分子结构。
3、基因名、位置及分类基因的名称,大部分来自生物学专有名词,如Green Fluorescent Protein (GFP),Cytochrome P450 Family 2 Subfamily E Member 1 (CYP2E1)等。
不同领域的科学家可能有不同的命名风格,这也加大了研究人员的协作难度。
除此之外,染色体、区段标记、转录起始位点等亦属基因命名的一部分。
同时,物种基因组的位置可用miRbase、GenBank、ENSEMBL等数据库中的坐标数字标注。
根据不同的功能、基因序列和其他特性,基因可以进行分类,例如同源基因家族、结构基因以及核心基因等。
二、基因组功能1、基因功能在真核生物基因组中,基因通常指一串DNA序列,包括起始密码子、终止密码子、外显子、内含子、调控序列等。
基因的功能可通过基因敲除、基因序列比对和表达谱技术等手段来探究。
2、基因调控基因调控是指细胞对基因表达的控制,它包括转录因子(TF)的操作、表观遗传学机制(如DNA甲基化、组蛋白修饰)以及非编码RNA的作用等。
真核细胞基因组结构与功能

第1页,共104页。
染色体的结构
染色体研究的历史背景
染色体的化学组成 核小体的结构
第2页,共104页。
染色体研究的历史背景:
1865年,Mendel(奥地利)历时八年,完 成了植株(豌豆)杂交试验,在此基础上 总结出二个著名遗传学定律:
分离定律 独立分配定律
“遗传因子”(genetic factor)是 Mendel 定律的基本思路,每一植株的各种相对性 状都来源两个相同的“遗传因子”,它们 有显性和隐性之分, “遗传因子”含义是 指决定遗传性状的基本遗传单位
第36页,共104页。
核小体结构(三)
3. 相邻核心颗粒由连接区 DNA 连接,其 伸展长度约20 nm(据认为天然状况下 由于核小体是紧挨着的,这一空间距离 可能并不存在)。H1组蛋白结合在靠核 心颗粒的连接区DNA上
第37页,共104页。
染色体的包装——超螺旋结构
核小体:染色体DNA的一级包装 由直径2nm的DNA双螺旋链绕组蛋白形 成直径11nm 的核小体 “串珠” 结构, 若以每碱基对沿螺旋中轴上升距离为 0.34 nm计,200bp DNA(一个核小体的 DNA片段)的伸展长度为 68 nm,形成 核小体后仅为11 nm(核小体直径),其 长度压缩了6-7倍
过10万个
说明:人类细胞基因组中有许多DNA序列 并不转录成mRNA用于指导蛋白质的合成
第45页,共104页。
真核生物基因组特点
1. 真核生物基因组DNA与蛋白质结合形成 染色体,储存于细胞核内, 除配子细胞 外, 体细胞内的基因的基因组是双份的 (即双倍体,diploid),即有两份同源的 基因组
有许多复制起始点,而每个复制子的长 度较小
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
裂中才可见的形态单位。
16:50 52
三、染色质的分类
常染色质(euchromatin)
(间期纤丝的包装密度度比分裂期染色体的要小很多)
异染色质(heterochromatin)
裂期染色体相比)
(间期纤丝染色质区的包装密度十分致密,可与有丝分
组成型异染色质 兼性异染色质
16:50
(constitutive
16:50 17
利用复性动力学鉴定基因组序列
零时复性序列
快速复性序列
中速复性序列
慢速复性序列
16:50
18
细胞器基因组
线粒体
叶绿体
16:50
19
第二节 断裂基因
在真核生物基因组中,一个基因的编
码序列在DNA分子上是不连续的,被非 编码序列所隔开,称为断裂基因
或不连续基因。
用以描述DNA的浓缩程度,即DNA的原始长 度除以包装后的长度。 如人类最小的染色体(Y):DNA拉直约为1.4 cm ,在有丝分裂最致密状态下,这条染色体 长度约为2μm,因此包装比可以大到7000。
16:50
37
真核生物基因组的包装
DNA 核小体 染色质 染色体
16:50 38
一、染色质的结构单位
16:50
染色体( 1400nm,2个染色单体, 每个染 色体单体含10个螺旋圈)
51
染色质和染色体的概念
染色质(chromatin):是指细胞周期间期细胞核内由 因其易被碱性染料染色而得名。
DNA、组蛋白、非组蛋白和少量RNA组成的复合结构, 染色体(chromosome):是指在细胞分裂期出现的 一种能被碱性染料强烈染色,并具有一定形态、结构特 征的物体。 携带很多基因的分离单位。只有在细胞分
16:50 20
外显子:具有编码意义
结
转录单位
内含子:无编码意义( 5′GT、
构
基 因
非编码区
3′AG;GT -AG法则) TATA框 前导区 启动子 CAAT框 尾部区 增强子 GC框:调节转录活动。 调控 区 mRNA裂解信号 终止子 回文结构
16:50
21
Interrupted gene
16:50
促进或抑制RNA聚合酶与它的结合。
16:50
8
⑥ 真核生物的RNA在细胞核中合成,只有经转运穿过核
膜,到达细胞质后,才能被翻译成蛋白质,原核生物
中不存在这样严格的空间间隔。
⑦ 许多真核生物的基因只有经过复杂的成熟和剪接过 程,才能顺利地翻译成蛋白质。
16:50
9
三 基因组与C值
基因组( genome ):一个物种单倍体的染色体
原核基因多数是单一顺序(unique-sequences),仅有少量 的重复顺序。 真核基因组含少量单一顺序和大量重复顺序
16:50
14
短片段的重复序列按重复方式不同可分为三 种类型:
(1)正向重复(direct repeats) :同一阅读方向上的 重复; (2)反向重复(inverted repeats) :反方向上的重 复; (3)回文顺序 (Palindromic sequence) :倒转重 复,反转对称。 5‘ GTGAGCTCAC 3’ 3’ CACTCGAGTG 5’
16:50
30
内含子(Intron)
起源
存在的意义与进化的关系
16:50
31
第三节基因家族和基因簇
假基因
是基因组中因突变而失活的基因,无蛋白质产 物。一般是启动子出现问题。
16:50
32
基因家族和基因簇
基因家族(gene family):是真核生物基因 组中来源相同,结构相似,功能相关的一组基 因。
16:50
12
四 基因的数量
差别很大
16:50
13
真核生物序列特征
(一)单一顺序 (nonrepetitive ):又称非重复序列,
在一个基因组中只有一个拷贝,原核生物基因多数是
单拷贝基因。
(二)重复顺序 (repetitive ):基因组中有多个拷贝,
重复程度不同,真核生物的一些基因中,常含有大量 的重复序列。
16:50
25
内含子(Intron)
相位
类型
GT-AC
16:50
26
内含子(Intron)
外显子与内含子的连接区序列很短,高度保守,
是RNA剪接的信号序列 5'GT——AG 3'
16:50
27
内含子(Intron)
特点
1.不具有序列特异性 2.保守性 3.决定基因的长度 4.相对性
16:50
含大量非编码 DNA
大量重复序列
16:50
2
存在 方式 真核 生物
原核 生物
16:50
组成
序列 特点
基因 特点
遗传物 质的组 成
细胞核 DNA
重复序 基因家 核染色 列多, 族、假 体和细 胞器基 单一序 基因 因组 列少。
类核
DNA和 重复序 重叠基 主染色 列少, 因、操 体和质 RNA 粒 单一序 纵子 列多。
分真核细胞的基因中间还存在不被翻译的内含子。
④ 真核生物能够有序地根据生长发育阶段的需要进
行DNA片段重排,还能在需要时增加细胞内某些基因
的拷贝数。
16:50
7
⑤ 在真核生物中,基因转录的调节区相对较大,它
们可能远离启动子达几百个甚至上千个碱基对,这些
调节区一般通过改变整个所控制基因5’上游区DNA 构型来影响它与RNA聚合酶的结合能力。 在原核生物中,转录的调节区都很小,大都位于启 动子上游不远处,调控蛋白结合到调节位点上可直接
所携带的一整套基因称为该物种的基因组。
16:50
10
基因组是指遗传物质的总量,可以用C值表
示。
C值(C value):一个单倍体基因组的全
部DNA含量。
对于 特定物种,C值是恒定的。
11
16:50
C值矛盾(C-value paradox)
具体表现:
与预期的编码蛋白质的基因数量相比,基因组DN A的含量过多,为什么? 一些物种之间的复杂性变化范围并不大,但C值却 有很大的变化范围。对于不同物种,C值差异较大。 C值的大小与物种的结构组成和功能的复杂性没有严 格的对应关系,这种现象称为C值矛盾。
基因簇(gene cluster):基因家族的各成员
紧密成簇排列成大段的串联重复单位,在同一
条染色体的特定区域,相对集中。基因簇内各 序列间的同源性大于基因簇间的序列同源性;
如组蛋白基因家族就成簇地集中在第7号染 色体长臂3区2带到3区6带区域内;
16:50
35
高度重复序列
卫星DNA (satellite DNA) :有些高度重复DNA 序列的碱基组成和浮力密度同主体DNA有区别, 在浮力密度梯度离心时,可形成不同于主体DNA 的卫星带,称之为卫星DNA 。
22
外显子(Exon) :真核细胞基因DNA中的编码序 列,这些序列被转录成RNA并进而翻译为蛋白 质。 内含子(Intron) :真核细胞基因DNA中的间插 序列,这些序列被转录成RNA,但随即被剪除 而不翻译。
16:50
23
16:50
24
外显子(Exon)
具有保守序列
对应基因的功能性单位 不同基因存在相关的外显子
第五章
真核生物的基因组结构
16:50
1
原核生物基因组
小, 环状 裸露DNA
真核生物基因组
大,线状 与组蛋白结合 线粒体 / 叶绿体
质粒 plasmid
操纵子 operon,多顺反子 基因是连续的
单顺反子
断裂基因 split gene 无重叠基因
有重叠基因
大部分序列都为编码序列 重复序列不多 (单拷贝)
28
内含子(Intron)
选择性剪接:同一基因的转录产物
由于不同的剪接方式形成不同mRNA。
16:50
29
PS DNA
外显子 S
PL
外显子 L
外显子 2
外显子 3
50b
2800bp
161bp
4500bp
205bp 327bp
初始转录本: 在唾腺中转录 成熟 mRNA: 1663nt 初始转录本: 在肝中转录 成熟 mRNA: 1773nt 图 18-57 小鼠淀粉酶(amy) 基因利用不同启动子产生两个不同的 mRNA
DNA(28%)
染色体
RNA (6%) 非组蛋白 Pr (66%) 组蛋白
16:50
41
核小体的概念
核小体(nucleosome):染色 质的基本结构亚基,由约200
bp的DNA和约等量的组蛋白所 组成。
16:50
42
染色质是一串核小体
16:50
当分裂间期的细胞核悬浮于低离子强度的溶液中时, 它们膨胀破裂,释放出染色质纤维(电镜图)
16:50 15
按重复程度不同可分为三种类型:
轻度重复序列(light repetitive):在一个基因组中有 2~10个拷贝,如组蛋白基因和酵母tRNA基因; 中度重复序列(moderately repetitive ):有10至几 百个拷贝,一般是不编码的序列,可能参与基因调控; 高度重复序列(highly repetitive):有几百个到几百 万个拷贝,如rRNA基因和某些tRNA基因。
43
核小体的结构组成