4真核生物基因组结构资料

合集下载

病毒、真核和原核生物的基因组结构特点

病毒、真核和原核生物的基因组结构特点

病毒、真核和原核‎生物的基因‎组结构特点‎病毒基因组‎结构特点:1.病毒基因组‎所含核酸类‎型不同2.不同病毒基‎因组大小相‎差较大3.病毒基因组‎可以是连续‎的也可以是‎不连续的4.病毒基因组‎的编码序列‎大5.基因可以是‎连续的也可‎以是间断的‎6.病毒基因组‎都是单倍体‎和单拷贝7.基因重叠8.病毒基因组‎功能单位或‎转录单位9.病毒基因组‎含有不规则‎结构基因(1)几个结构基‎因的编码区‎无间隔(2)结构基因本‎身没有翻译‎起始序列(3) mRNA没‎有 5’端的帽结构‎原核生物基‎因组结构特‎点:1.细菌等原核‎生物的基因‎组是一条双‎链闭环的D‎N A分子2.具有操纵子‎结构3.原核基因组‎中只有1个‎复制起点4.结构基因无‎重叠现象5.基因序列是‎连续的,无内含子,因此转录后‎不需要剪切‎6.编码区在基‎因组中所占‎的比例远远‎大于真核基‎因组,但又远远小‎于病毒基因‎组。

非编码区主‎要是一些调‎控序列7.基因组中重‎复序列很少‎8.具有编码同‎工酶的基因‎9.细菌基因组‎中存在着可‎移动的DN‎A序列,包括插入序‎列和转座子‎10.在DNA分‎子中具有多‎种功能的识‎别区域,如复制起始‎区、复制终止区‎、转录启动区‎和终止区等‎。

这些区域往‎往具有特殊‎的序列,并且含有反‎向重复序列‎真核生物基‎因组结构特‎点:1)真核基因组‎远远大于原‎核生物的基‎因组。

2)真核基因具‎有许多复制‎起点,每个复制子‎大小不一。

每一种真核‎生物都有一‎定的染色体‎数目,除了配子为‎单倍体外,体细胞一般‎为双倍体,即含两份同‎源的基因组‎。

3)真核基因都‎出一个结构‎基因与相关‎的调控区组‎成,转录产物的‎单顺反子,即一分子m‎R NA只能‎翻译成一种‎蛋白质。

4)真核生物基‎因组中含有‎大量重复顺‎序。

5)真核生物基‎因组内非编‎码的顺序(NCS)占90%以上。

编码序列占‎5%。

6)真核基因产‎断列基因,即编码序列‎被非编码序‎列分隔开来‎,基因与基因‎内非编码序‎列为间隔D‎N A,基因内非编‎码序列为内‎含子,被内含子隔‎开的编码序‎列则为外显‎子。

真核原核细胞基因结构示意图

真核原核细胞基因结构示意图

基因结构
真核细胞的基因结构通常包括编码区和非编码区,其中编 码区被内含子和外显子分隔;而原核细胞的基因结构相对 简单,没有内含子和外显子的区分。
染色体结构
真核细胞的染色体由DNA和蛋白质组成,呈现高度折叠的 结构;原核细胞的染色体则是由环状DNA分子组成,结构 相对简单。
复制方式
真核细胞的基因复制需要多种蛋白质的参与,复制过程复 杂;而原核细胞的基因复制则相对简单,不需要太多蛋白 质的参与。
遗传信息的储存和复制
遗传信息的储存
基因是遗传信息的载体,通过DNA双螺旋结构,将遗传信息稳定 地储存于细胞核或细胞质中。
复制机制
原核细胞通过半保留复制方式,真核细胞通过半不连续复制方式 ,确保遗传信息的准确传递。
基因表达与调控
转录过程
在RNA聚合酶的作用下,DNA的 遗传信息被转录为mRNA,为蛋
染色体数目与形态
80%
染色体数目
原核细胞通常只有一条染色体, 但在某些情况下可能存在多条染 色体。
100%
染色体形态
原核细胞的染色体呈环状或线性 ,没有真核细胞的染色体结构复 杂。
80%
复制与分离
原核细胞的染色体复制和分离机 制相对简单,通常只有一个复制 起点。
03
真核原核细胞基因结构的比较
结构差异
真核原核细胞基因结构示意图

CONTENCT

• 真核细胞基因结构 • 原核细胞基因结构 • 真核原核细胞基因结构的比较 • 真核原核细胞基因结构的功能 • 真核原核细胞基因结构的研究意义
01
真核细胞基因结构
结构特点
真核细胞基因结构包括 编码区和非编码区,其 中编码区又分为内含子 和外显子。

真核生物的基因表达调控

真核生物的基因表达调控

31
• 锌指结构域The zinc finger domain
锌指结构有2种形式: C2H2 zinc finger和C4 zinc finger •C2H2 zinc finger:由12个氨基酸组成的环,通过2个半胱氨 酸(C,Cys)和2个组氨酸(H,His)残基固定,这4个残基 与Zn2+在空间上形成一个四面体结构。 一般情况下需要3个 或更多的C2H2型锌指才能与DNA结合,如在TFIIA有9个重复, 转录因子SP1有3个重复。 •C4 zinc finger: Zn2+与4个半胱氨酸(C,Cys)结合,存 在于类固醇激素受体转录因子中。
限定于结构域之内。
26
反式作用因子的结构与功能
(1)概念:为DNA结合蛋白,核内蛋白,可使邻近基因开 放(正调控)或关闭(负调控)。
(2)通用或基本转录因子—RNA聚合酶结合启动子所必需 的一组蛋白因子。如:TFⅡA、 TFⅡB、 TFⅡD、 TFⅡE 等。 (3)特异转录因子( special transcription factors)—个别 基因转录所必需的转录因子.如:OCT-2:在淋巴细胞中特 异性表达,识别Ig基因的启动子和增强子。
(2) 动态模型(dynamic model):认为转录因子与组 蛋白处于动态竞争之中,基因转录前染色质必须经 历结构上的改变,即染色质重塑。在染色质重塑过 程中,某些转录因子可以在结合DNA的同时使核小 体解体。
6
组蛋白的乙酰化-去乙酰化 蛋白的乙酰化和去乙酰化是蛋白活性调节的一种 重要的形式,通过乙酰化或去乙酰化,改变了染色质 结构或是转录因子的活性,可以调节基因转录的活性。 组蛋白的乙酰化和去乙酰化能打开或关闭某些基因, 增强或抑制某些基因的表达。 组蛋白的8个亚基上有32个潜在的乙酰化位点。组 蛋白的乙酰化过程由组蛋白乙酰转移酶催化完成。

简述真核生物基因组的结构特点

简述真核生物基因组的结构特点

简述真核生物基因组的结构特点
真核生物基因组的结构特点总结归纳如下:
1真核基因组庞大,一般都远大于原核生物的基因组。

2真核基因组存在大量的重复序列。

3真核基因组的大部分为非编码序列,占整个基因组序列的90%以上,该特点是真核生物与细菌和病毒之间最主要的区别。

4真核基因组的转录产物为单顺反子。

5真核基因是断裂基因,有内含子结构。

6真核基因组存在大量的顺式作用元件,包括启动子、增强子、沉默子等。

7真核基因组中存在大量的DNA多态性。

DNA多态性是指DNA序列中发生变异而导致的个体间核苷酸序列的差异,主要包括单核苷酸多态性和串联重复序列多态性。

8真核基因组具有端粒结构。

生物化学 4-基因和基因组的结构与功能

生物化学 4-基因和基因组的结构与功能
式组织在一起。1个转录单位通常含3个rDNA,以16S-23S-5S的顺序串联 排列,有的转录单位中间还插有tRNA基因,每个转录单位的长度大于 5Kb。转录后先得到rRNA前体,再剪切成16S、23S和5SrRNA
4. 结构基因中无内含子,边转录边翻译。
5. 无基因重叠结构。
6. DNA分子中有多种功能区。这些区域往往具有特殊的结构,并且含 有反向重复序列。
8、基因组中也存在一些可移动的遗传因素,这些DNA顺 序并无明显生物学功能,似乎为自己的目的而组织, 故有自私DNA之称,其移动多被RNA介导(如在哺乳 动物及人类基因组中发现的逆转座子),也有被DNA 介导的(如在果蝇及谷类中发现的DNA转座子)
单一序列 中度重复序列
高度重复序列
重复序列
将真核生物基因组的DNA进行复性动力学测 定,显示3个不同的时相。
• 一个假基因常常有多个有害的突变,可能因为作为一种活 性基因一旦停止,就再没有适当机制阻止进一步突变的聚 积。假基因数目一般较少,往往只占基因总数的一小部分。
假基因主要有两种类型
• (1)由于一种基因的加倍而失活。这种类型假基因保留原 来亲本基因的外显子及内含子组织并常与亲本基因密切联 系,如α、β球蛋白基因簇的假基因。它们可能是由于失去 起始转录信号,或外显子—内含子连接处不能剪接或翻译 不能终止。
蛋白D 蛋白E
E.coli
细菌基因组
1. 一条双链DNA ,具有类核结构。
2. 具有操纵子结构。几个功能相关的结构基因串联在一起受同一个调控区调 节。 E.coli基因组含3500个基因,有260个已查明具有操纵子结构,定位于75个 操纵子中。
3. 蛋白质基因单拷贝,rRNA基因多拷贝,这可能有利于核糖体的组装。 E.coli中rRNA基因(rDNA)具有多拷贝,而且都以转录单位的形

第十一章 真核基因与基因组

第十一章  真核基因与基因组


3. 单拷贝序列(低度重复序列)
单拷贝序列在单倍体基因组中只出现一次或数次,大多数编码蛋
白质的基因属于这一类。在基因组中,单拷贝序列的两侧往往为
散在分布的重复序列。单拷贝序列编码的蛋白质在很大程度上体
现了生物的各种功能。
三、真核基因组中存在大量的多基因家族和假基因
1. 多基因家族(multigene family)
• 在单倍体人基因组中重复达30~50万次,约占人基因组
的3%~6%
• 每个单位长度中有一个限制性内切酶Alu的切点
(AG↓CT),将其切成长130bp和170bp的两段
② KpnⅠ家族 • 中度重复序列中仅次于Alu 家族的第二大家族 • 重复序列中含有限制性内切酶KpnⅠ的位点 • 呈散在分布,拷贝数约为3000~4800个 ③ Hinf 家族 • 以319bp长度的串联重复存在于人基因组中 • 重复序列中含有限制性内切酶Hinf Ⅰ的位点
三、调控序列参与真核基因表达调控
位于基因转录区前后并与其紧邻的DNA序列通常是基因的调控
区,又称为旁侧序列(flanking sequence)。这些调控序列又
被称为

(cis-acting element),包括
、 、

和一些细胞信号反应元
件等。
真核基因及调控序列的一般结构
1. 启动子提供转录起始信号 启动子是DNA分子上能够介导RNA聚合酶结合并形成转录起始复合体
能,使它们不能再编码RNA和蛋白质产物;经过加工的假基因通常缺少 正常基因表达所需的调节序列、没有内含子、可能有poly(A)尾。
(2)未经过加工的假基因:来源于多拷贝或单拷贝基因的突变
(2)增强子序列距离所调控基因距离近者几十个碱基对,远 的可达几千个碱基对。 (3)通常数个增强子序列形成一簇,

基因组的结构特点

基因组的结构特点

二、单拷贝基因
单拷贝基因:基因组中仅出现一次的基因 特点: (一)单顺反子 (二)断裂基因:内含子(intron),外显子(exon)
原核生物的多顺反子 5 PPP
真核生物的单顺反子 5 mG - PPP
非编码序列 编码序列
3 蛋白质
3 蛋白质
核蛋白体结合位点
起始密码子
终止密码子
目录
三、真核生物基因组的重复序列
第三章 真核生物基因组
第一节 真核生物染色体基因组
一、真核生物染色体基因组的一般特征 二、单拷贝基因 三、重复序列 四、基因家族 五、端粒和端粒酶 六、基因移动 七、果蝇基因组概述
一、真核生物染色体基因组的一般特征
1. 基因组庞大 2. 线状双链DNA和二倍体 3. 非编码区远多于编码区 4. 断裂基因(split gene) 5. 存在大量重复序列
3.转导(transduction)是以噬菌体为媒介把 细菌的基因从一个细菌细胞转移到另一个细 菌细胞的过程。
4.转座(transposition)指遗传物质被转移的 现象。
1. 接合
当细胞与细胞、或细菌通过菌毛相互接触时,质粒DNA从一个细胞(细菌)转移至另一细胞 (细菌)的DNA转移称为接合(conjugation)。
基因组的结构特点
第二章 原核生物基因组
第一节 原核生物基因组的一般特征
1. 原核生物的基因组为DNA分子 较小,在106-107之间 通常为一条环状双链DNA分子 只有一个复制起始点. 基因组DNA与支架蛋白和RNA结合,形成类核.
大肠杆菌类核结构照片图
类核结构由中央和外围组成 原核生物类核结构示意图
1. 基因组DNA分子量较小 2.64×109Da位于细胞中央, 形成一个致密的区域,称为类核(nucleoid) 。 2. 存在操纵子(operon)结构。 3. 结构基因是单拷贝,连续排列没有内含子成分。 4. 编码顺序一般不重叠。 5. 具有编码同工酶的不同基因。 6. 基因组编码区占50﹪左右。 7. 存在多种功能的识别区,常以反向重复序列存在。 8. 存在可移动成分。

基因概念,真核生物结构基因特点及结构

基因概念,真核生物结构基因特点及结构
目前的克隆技术 线粒体基因 体细胞染色体的不一致性 表观遗传 染色体外因素
基因的概念,真核生物结构基因的特点 及结构
基因的分类二
1、结构基因(structural gene) 指能决定蛋白质分子结构的基因。
2、调控基因(regulatory gene) 指可调节控制结构基因表达的基因。
基因的概念,真核生物结构基因的特点 及结构
DNA分子结构
基因的概念,真核生物结构基因的特点 及结构
DNA分子结构
熟悉
基因的概念,真核生物结构基因的特点 及结构
基因的概念,真核生物结构基因的特点 及结构
Linus Carl Pauling
theoretical physical chemist
two unshared Nobel Prizes
一个完整的双链DNA分子,与复制前的双链DNA分子保持完全 一样的结构。
半保留性:两条模板链分别成为子代DNA分子双链中的一条链,
即在每个子代DNA分子的双链中,总是保留着一条亲链。
反向平行性:DNA分子的两条双链之间是反向平行的,一条是
5′→3′,另一条必然是3′→5′。新复制出来的DNA分子的子链与 亲链也是反向平行的。
基因的概念,真核生物结构基因的特点 及结构
了解
人 类 基 因 组 的 组 织 结 构
基因的概念,真核生物结构基因的特点 及结构
掌握
基因功能的实现,依赖DNA复制,转录 和翻译,可概括为遗传信息传递的“中心法则”。
DNA 复制
转录 反转录
RNA 复制
翻译 蛋白质
中心法则
基因的概念,真核生物结构基因的特点 及结构
基因的概念,真核生物结构基因的特点 及结构

基因组的结构和功能

基因组的结构和功能
一旦离开宿主就无法复制和扩增。但质粒对宿
主细胞的生存不是必需的,宿主细胞丢失了质
粒依旧能够存活。
质粒所携带的遗传信息能够赋予细菌特定的
遗传性状,能把外源基因(目的基因)送到
宿主细胞中去克隆扩增或克隆表达。因此质
粒是基因工程的重要载体(vector)。
三、转座元件
转座元件(transposable element)/转座子 (transposon)是指能够在DNA分子内部或DNA 分子之间移动的DNA片段或基因。 它们从基因组的一个部位直接转移到另一个部 位,这个过程称为转座(transposition)。
分离出来。
人类基因组中可分离出三类卫星DNA ,共占
人类基因组的5 ~ 6%:
① 大卫星DNA(macrosatellite DNA):

其重复单位为 5~171 bp ,主要分布于染色
体的着丝粒区。
② 小卫星DNA(minisatellite DNA):

其重复单位为 15~70 bp ,存在于常染色体。
野野 鸟鸟 啼啼 时时 有有 思思
重叠基因(overlapping gene)即同一段DNA
片段能够以两种或两种以上的阅读方式进行阅
读,因而可编码两种或两种以上的多肽。
按重叠方式不同,可分为完全重叠和部分重叠
噬菌体×174的重叠基因
逆转录病毒
逆转录病毒是属于RNA病毒的一个大科。
所有逆转录病毒的共同特点是能够携带或编码 合成逆转录酶。
Alec J.Jeffreys和历史上第一张DNA指纹图谱
1802年的一副杰斐逊和莎莉的讽刺画像
(二)中度重复序列: 中度重复序列是指在基因组中重复数十次
至数万次的部分,其复性速度快于单拷贝

阐述真核生物基因组结构特点

阐述真核生物基因组结构特点

真核生物是一类拥有真正的细胞核的生物。

它们的基因组结构与原核生物不同,具有以下几个特点:1.基因组大小不一:真核生物的基因组大小不一,从数百万到数十亿个碱基对不等。

这是因为真核生物的基因组中不仅包含编码蛋白质的基因,还包含其他功能基因,如调控基因、功能未知基因等。

2.基因组有组织结构:真核生物的基因组呈现出组织结构,分布在染色体上。

染色体是由DNA 和蛋白质构成的,在细胞核内进行染色体分离和细胞分裂过程中发挥重要作用。

3.基因组中含有多种基因:真核生物的基因组中含有多种基因,包括编码蛋白质的基因、调控基因、功能未知基因等。

这些基因在基因组中的分布不均匀,有的集中在染色体的某些区域,有的分布在整个基因组的各个部分。

4.基因组中含有冗余信息:真核生物的基因组中含有大量冗余信息,即同一基因的多个副本。

这是因为真核生物的基因组经常经历染色体重组,使得同一基因的多个副本分布在染色体的不同位置,从而增加了基因组的冗余度。

冗余信息在基因组的稳定性中起着重要作用,可以在基因组遭受损伤时提供替代品。

5.基因组中含有跨基因区:真核生物的基因组中含有跨基因区,即与编码蛋白质无关的DNA 序列。

这些序列可能具有调控基因表达的功能,也可能是遗传信息的载体。

跨基因区在基因组的结构和功能中发挥着重要作用。

总的来说,真核生物的基因组结构具有复杂性和多样性,与原核生物相比具有较大的差异。

这些差异决定了真核生物的生物学特征,如多倍体、染色体分离、细胞分裂、发育等。

研究真核生物的基因组结构,不仅有助于我们了解真核生物的生物学特征,还能为我们提供重要的基础知识,帮助我们解决生物学问题。

掌握真核生物基因组的结构特点

掌握真核生物基因组的结构特点
6. α卫星 DNA 成簇的分布在染色体着丝粒附 近,可能与减数分裂时染色体配对有关,即 同源染色体之间的联会可能依赖于具有染色 体专一性的特定卫星DNA顺序
第三节 基因家族
一、基因家族的类型和Alu家族 基因家族(gene family):真核生物的基因组
中有许多来源相同、结构相似、功能相关的 基因,这样的一组基因称为一个基因家族。 假基因(pseudogene):同一个基因家族的成员 也不一定都是有功能的,没有功能的成员称 为假基因。
卫星DNA(satellite DNA)
▪ 重复顺序:由2-10bp组成重复单位,重复单位成串排列 而成
▪ 由于这类序列的碱基组成不同于其他部份,可用等密度梯 度离心法将其与主体DNA 分开,因而称为卫星DNA (或 随体DNA)
• 在人细胞组中,卫星 DNA约占 5-6% ,按其浮力密度不同,可分 为Ⅰ、Ⅱ、Ⅲ、Ⅳ四种;
如果基因组中每一种基因只有一个,即都是单拷贝序列,那 么基因组愈大则基因组的复杂性愈大,复性速率愈小,k也 愈小,所以C0t1/2与非重复序列的基因组大小呈正比。
二、DNA序列的类别
不同生物基因组的C0t1/2是不相同的,C0t1/2 的位置除了决定于基因组的大小以外,还取 决于每个基因的核苷酸序列的重复次数,重 复次数愈少则复性愈慢,C0t1/2的位置愈后, 重复次数愈多,C0t1/2位置愈前。
第十四章 真核生物的遗传分析
1.教学目的和要求 (1)掌握真核生物基因组的结构特点。 (2)了解基因家族的概念与类型。 2.教学重点 (3)熟悉真核生物基因组的包装形式。 (4)学习常见遗传标记的类型、特征和应用。
第一节 真核生物基因组
一、基因组与C值 • 基因组:一个物种单倍体的染色体的数目及

真核生物染色体基因组的结构和功能

真核生物染色体基因组的结构和功能

真核生物染色体基因组的结构和功能∙真核生物基因组特点∙高度重复序列o反向重复序列o卫星DNAo较复杂的重复单位组成的重复顺序o高度重复序列的功能∙中度重复顺序o Alu家族o KpnⅠ家族o Hinf家族o rRNA基因o多聚dT-dG家族o组蛋白基因∙单拷贝顺序(低度重复顺序)∙多基因家族与假基因∙自私DNA(selfish DNA)真核生物的基因组一般比较庞大,例如人的单倍体基因组由3×106 bp硷基组成,按1000个碱基编码一种蛋白质计,理论上可有300万个基因。

但实际上,人细胞中所含基因总数大概会超过10万个。

这就说明在人细胞基因组中有许多DNA序列并不转录成mRNA用于指导蛋白质的合成。

DNA的复性动力学研究发现这些非编码区往往都是一些大量的重复序列,这些重复序列或集中成簇,或分散在基因之间。

在基因内部也有许多能转录但不翻译的间隔序列(内含子)。

因此,在人细胞的整个基因组当中只有很少一部份(约占2-3%)的DNA 序列用以编码蛋白质。

真核生物基因组有以下特点。

1.真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即双倍体,diploid),即有两份同源的基因组。

2.真核细胞基因转录产物为单顺反子。

一个结构基因经过转录和翻译生成一个mRNA 分子和一条多肽链。

3.存在重复序列,重复次数可达百万次以上。

4.基因组中不编码的区域多于编码区域。

5.大部分基因含有内含子,因此,基因是不连续的。

6.基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。

高度重复序列:高度重复序列在基因组中重复频率高,可达百万(106)以上,因此复性速度很快。

在基因组中所占比例随种属而异,约占10-60%,在人基因组中约占20%。

高度重复顺序又按其结构特点分为三种。

(1)倒位(反向)重复序列这种重复顺序复性速度极快,即使在极稀的DNA浓度下,也能很快复性,因此又称零时复性部分,约占人基因组的5%。

真核生物细胞器基因组概述

真核生物细胞器基因组概述

真核细胞器基因组概述真核生物细胞器基因组概述中文摘要真核生物的基因组分为细胞核基因组和细胞器基因组。

细胞核基因组,占绝大多数的基因都由核基因组控制;细胞器基因组,与该细胞器功能相关的少数基因由该细胞器自身控制。

它们的基因结构、转录和翻译不一样,核基因组是真核的系统,细胞器基因组类似原核生物的系统。

核基因组占控制地位,它调控细胞器基因组,但后者也可以调节核基因组基因的表达。

本文主要对真核生物细胞器基因组进行描述。

关键字:真核生物基因组细胞器基因组Overview of eukaryotic organelle genomesAbstractEukaryotic genome into the nucleus genome and organelle genomes. Nuclear genome,the majority of genes controlled by the nuclear genome; organelle genomes, cells,functions associated with the small number of genes controlled by the organelle itself.Their gene structure, transcription and translation is not the same, eukaryotic nucleargenome is a system, organelle genomes like prokaryotes system. Total control of thenuclear genome position, which regulate organelle genome, but the latter can also adjustthe nuclear genome gene expression. In this paper, the genome of eukaryotic organellesare described.Keywords:Eukaryotes genomes organelle genomes前言基因组,Genome,一般的定义是单倍体细胞中的全套染色体为一个基因组,或是单倍体细胞中的全部基因为一个基因组。

4真核生物基因组结构复习课程

4真核生物基因组结构复习课程
同一初始转录本产生不同mRNA的剪接方式称为 可变剪接。
2022/2/3
肌钙蛋白基因内含子的可变剪接,产生α和β两种类型的蛋白
2022/2/3
3.内含子存在的意义及与进化的关系
➢有利于储存更多的遗传信息,增加信息量。 由于可变剪接的存在…….. ➢增加了重组概率: 基因总长度增加…….. 可变剪接的存在…….. ➢有利于生物体的变异和进化: 增加了重组概率,还会造成基因突变。
2022/2/3
第三节 基因家族和基因簇
( Gene family 、 Gene cluster)
基因家族(Gene family):真核生物的基因组中许多来源 相同,结构相似、功能相关的一组基因。
2022/2/3一、基源自家族1.基因家族的成因 基因家族的各个成员都是由某一祖先基因经重复 (复制)和突变产生的。 2.基因家族的特点 基因家族的各个成员之间来源相同,结构相似、 功能相关。
DNA复性过程中复性的速度用公式表示: dC/dt= -kC02
其中,C是单链DNA在t时刻的浓度。 2022/2/3 k=复性速度常数
对上式积分后重排,得出复性动力学方程: C/C0=1/(1+ k C0t)
C0为单链DNA的起始浓度,C为单链DNA在t时刻的浓度, 单位mol/L。 t为复性时间,单位为s(秒)。重组速率常数k的 单位为L/mol,取决于阳离子的浓度、温度、片段大小和DNA 序列的复杂性。
复性反应分为 三P相74,图每-相16代 表不同复杂长 度的序列类型
2022/2/3
根据复性动力学特征的不同,将真核生 物DNA序列分为4类: 零时复性序列 快速复性序列 中速复性序列 慢速复性序列
2022/2/3
1)零时复性序列:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3)基因的总长度主要由内含子决定 4)内含子的相对性:
一个基因的内含子可能是另一个基因的外显子, 所以一些DNA序列可以编码一种以上的蛋白质。
同一初始转录本产生不同mRNA的剪接方式称为 可变剪接。
肌钙蛋白基因内含子的可变剪接,产生α和β两种类型的蛋白
3.内含子存在的意义及与进化的关系
有利于储存更多的遗传信息,增加信息量。 由于可变剪接的存在…….. 增加了重组概率: 基因总长度增加…….. 可变剪接的存在…….. 有利于生物体的变异和进化: 增加了重组概率,还会造成基因突变。
2)快速复性序列:
也叫高度重复序列(Highly repetitive sequence)
• 占基因组的10-60%,长度6~ 200bp ,重复次数在 105以上。
• 大部分集中于异染色质区 ,特别是在着丝粒和 端粒区,往往没有转录功能 。
真核生物DNA 复性曲线的模 式图
复性反应分为 三P相74,图每-相16代 表不同复杂长 度的序列类型
生的假基因带有内含子,称为未加工假基因或复制假 基因 。 返座(retrotransposition)
即mRNA转录本经过反转录为cDNA,再插入基因 组,由于插入位点不合适或序列发生变化而导致失去 功能。这种类型的假基因不含内含子,被称为已加工 假基因或返座假基因。
二、基因簇(gene cluster )
1-c/c0
复杂性X 1
复 性 分 数 ( )
Cot
不同原核生物的Cot曲线
真核生物DNA 复性曲线的模 式图
复性反应分为 三P相74,图每-相16代 表不同复杂长 度的序列类型
根据复性动力学特征的不同,将真核生 物DNA序列分为4类: 零时复性序列 快速复性序列 中速复性序列 慢速复性序列
相同核苷酸数量的DNA,复杂性小的DNA分子复性 快,Cot (1/2)值小;复杂性大的DNA分子复性慢,Cot (1/2) 大。
Cot曲线:表示复性速度与DNA顺序复杂性的关系。
Cot曲线
2.利用复性动力学鉴定基因组序列
原核生物Cot曲线的特点:
形状相似(跨越2-3个数量级),Cot(1/2)不相同 --单一序列,只是复杂性不同。
因家族, 一般往往以基因家族的形式存在。
Alu family(Alu 家族):
•长约300bp的片段,大多数片段含有一个限制性内切 酶AluⅠ的酶切位点(AGCT); • 均匀分散在整个基因组中的非重复序列间; • 在人类基因组中占1% ~ 3%;
4)慢速复性序列:
C0t1/2一般在103mol.s/L以上,复性速度极慢, 在一个基因组中只有一个拷贝或2~3个拷贝,也 称非重复序列(单一序列、单拷贝序列)。 结构基因 (蛋白质基因)大多是单拷贝序列。
1)零时复性序列:
具有反向重复结构(也称回文结构),可在 同一条链内形成双链区,变性后再复性时,在链 间复性之前就已发生链内复性,因此不遵循二级 反应动力学方程。由于这种序列的复性速度非常 快,在动力学上称为零时(或瞬时)复性序列。
DNA复性后可出现发卡形结构。这种序列常 常是DNA复制酶、转录酶以及特异蛋白质的结合 部位。
三、真核生物基因组的非重复序列和重复序列
1. DNA复性动力学
DNA的复性过程遵循二级反应动力学。
DNA复性过程中复性的速度用公式表示: dC/dt= -kC02
其中,C是单链DNA在t时刻的浓度。 k=复性速度常数
对上式积分后重排,得出复性动力学方程: C/C0=1/(1+ k C0t)
C0为单链DNA的起始浓度,C为单链DNA在t时刻的浓度, 单位mol/L。 t为复性时间,单位为s(秒)。重组速率常数k的 单位为L/mol,取决于阳离子的浓度、温度、片段大小和DNA 序列的复杂性。
二、真核生物基因组的基因数量
不同物种编码基因差别很大,从500个到50000个, 有100倍的差距。
真核生物的基因数量通常在6000到50000之间。 人的基因组的全长为大约3 X 109对碱基,编码 3-4 万个基因; 但某些寄生的真核生物,如脑微孢子虫,基因数量 可能不超过3000个,比很多细菌的基因数量还少。
mRNA
DNA
鸡卵清蛋白成熟mRNA与DNA杂交电镜图
断裂基因
前体mRNA
Introns 去除 Exons 连接
1.内含子的相位和类型
(1) 内含子相位
内含子可以出现在转录本的任何位置,甚至在以后成为密 码子的三核苷酸之间。
若内含子位于一密码子的第三位核苷酸和另一密码子的第 一位核苷酸(即两密码子之间),则被称为0位内含子;相应地, 位于一密码子的第一位和第二位核苷酸之间的内含子被称为1位 内含子;位于第二和第三位之间时,则被称为2位内含子。
•同一门中的动物C值变化很大 如:两栖类中的C值变化很大,可相差100倍 家蝇的比果蝇的大6倍
说明真核生物基因组中许多的DNA序列不编码蛋白质。
植物 鸟类 哺乳动物 爬行动物 两栖动物 硬骨鱼 软骨鱼 棘皮动物 甲壳动物 昆虫 软体动物 蠕虫 霉菌 藻类 真菌 格兰氏阳性菌 格兰氏阴性菌 支原体
阴影部分为一个门内C-值的范围
3)中速复性序列:
也叫中度重复序列(moderate repetitive sequences)
基因组中重复次数<105的重复顺序,重复单位平均长 度约300bp;
复性速度快于单拷贝顺序,慢于高度重复顺序。 多与单拷贝基因间隔排列。 多为非编码序列,如Alu序列 也有编码基因产物的,如rDNA、tDNA、组蛋白基
第三节 基因家族和基因簇
( Gene family 、 Gene cluster)
基因家族(Gene family):真核生物的基因组中许多来源 相同,结构相似、功能相关的一组基因。
一、基因家族
1.基因家族的成因 基因家族的各个成员都是由某一祖先基因经重复 (复制)和突变产生的。 2.基因家族的特点 基因家族的各个成员之间来源相同,结构相似、 功能相关。
人类珠蛋白基因家族---典型的基因家族
珠蛋白 血红蛋白
血红素
α2β2 不同的亚基由各自的基因编 码
血红蛋白( Hb )
发育过程中的珠蛋白的亚基组成
类α链
α2γ2
2% 97% 1%
类β链
两种亚基的编码基因分别形成两个不同的基因簇, 并存在于不同的染色体上。
每个基因簇中的基因按其在发育过程中的表达次序从 5’→3’排列在编码链上(其中包括有功能的基因和假基 因)
3.假基因( Pseudogenes ):
概念:基因组中存在的一段与正常基因非常相似但不 能表达的DNA序列。
分为两大类: 一类保留了相应功能基因的间隔序列; 另一类缺少间隔序列,称为加工过的假基因或返座 假基因。
假基因(pseudogene)具有与功能基因相似的序列, 但由于有许多突变以致失去了原有的功能,所以假 基因是没有功能的基因,常用ψ表示。
原初转录物中通过RNA拼接反应而保留于成熟 RNA中的序列或基因中与成熟RNA序列相对应的 DNA序列。
DNA 与成熟RNA间的对应区域 非间隔区(unspacer) 氨基酸的编码区(amino acid coding region)
1.外显子具有保守的序列
不同物种中的同源基因的外显子序列通常是保守 的。尤其是编码区内的外显子具有很强的保守性,但 处于5’和3’非编码区的外显子有时会发生变化。
一个重复单位(基因簇 gene cluster)的组织情况:
海胆: H1
H4
H2B
H3
H2A
不转录间隔区 组织方式因不同生物而异: 基因次序、间隔区的长短、重复频率
组蛋白基因表达特点:① 没有内元 ② 没有多聚A尾巴
1010 109 108 107 106




蠕昆鸟
两哺




虫虫类
栖乳

类类
☆ C值悖理理论(C-value paradox)
指 C值与生物进化复杂性之间不相对应的现象,也 叫 C值反常理论。
表现:
•低等动物的C值大于高等动物 如:两栖类的C值大于哺乳类 肺鱼的C值比哺乳动物大10-15倍
小)相同的前提下,DNA分子的C0t (1/2)值,取决于核苷 酸的排列exity) X:最长的没有重复序列 的核苷酸对的数值。
AAAAAAAA
X=1
ATCGATCGATCG X = 4
N= 105
X = 105
X= k Cot1/2
Cot(1/2) = 1/k (mol. Sec / L)
第四章 真核生 物基因组结构
第一节 真核生物基因组的组成
一、真核生物基因组的大小
C值(C-value):一个物种单倍体基因组的DNA含量, 通常称为该物种的C值。
每个物种的C值是相对恒定的,不同物种的C值差 异极大。
一般随着生物结构和功能复杂程度的增加而C值增 大,即:生物细胞中的C值具有从低等生物到高等生物 逐渐增加的趋势。
真核生物DNA 复性曲线的模 式图
复性反应分为 三P相74,图每-相16代 表不同复杂长 度的序列类型
大部分结构基因 位于非重复的 DNA序列内
第二节 断裂基因(split gene)
不连续基因(interrupted gene)
编码某一RNA的基因中有些序列并不出现在成熟 的RNA序列中,成熟RNA的序列在基因中被其他的 序列隔开。
概念:基因家族中来源相同、结构相似和功能相关的 在染色体上彼此紧密连锁的一组基因。
它们属于同一个祖先的基因扩增产物,也常常包 括一些没有生物功能的假基因。 如:编码催化同一新陈代谢途径的不同步骤的酶的结 构基因 。这些基因各自编码的酶常能组成多酶复合物。 细菌同一操纵子中的几个结构基因也可称为基因簇 。
相关文档
最新文档