真核生物基因组资料
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 真核生物基Leabharlann Baidu组
李建平
第三章 真核生物基因组
引言: 真核生物基因组比较庞大,并且不同生物种间 差异很大。
例如,人类单倍体基因组由3.16x109bP组成,如果以 1000个碱基编码一种蛋白质来计算,理论上可有300万 个基因。但实际上只有很少部分(约占2%—3%)的DNA 序列用于编码蛋白质。基因总数大概3.5万个。
由较复杂的重复单位所 组成,灵长类所独有。
卫星DNA或随体DNA(Satellite DNA)
因碱基组 成不同于其他 部分,用等密 度梯度离心法 可将卫星DNA 与主体DNA分 开。
CsCl等密度梯度离心
高度重复顺序的主要功能:
①参与复制水平的调节
②参与基因表达的调控
③参与转位作用:几乎所有转位因子的末端都包含反向重复 序列,可以形成回文结构,既能连接非同源的基因,又可 以被参与转位的特异酶所识别;
DNA的复性动力学研究:非编码区往往都是重 复序列。
第一节 真核生物基因组特点
1.分为细胞核基因组与细胞质基因组: 细胞核基因组是双份的(二倍体,diploid),即有两份
同源的基因组。 细胞质基因组可有许多拷贝。
2.真核细胞基因转录产物为单顺反子:一个结构基因经过 转录和翻译生成一个mRNA分子和一条多肽链。
●内含子(intron):
是结构基因中的非编码序列,往往与编码序列呈间隔排列。 当基因转录后,在mRNA的成熟过程中被剪切(splicing)。
●外显子(exon):
是结构基因中的编码序列,往往被内含子所间隔, 当基因 转录后,mRNA在成熟过程中切去内含子,外显子才被拼接成 完整的序列,成为成熟的mRNA作为指导蛋白质合成的模板。
中度重复顺序的主要功能
★ 中度重复序列大多不编码蛋白质。 ★有些中度重复序列则是编码蛋白质或
rRNA的结构基因:如HLA基因、rRNA基因、 tRNA基因、组蛋白基因、免疫球蛋白基 因等。 ★中度重复序列一般具有种属特异性。
(三)低度重复序列
在单倍体基因组中只出现一次或数次,因 而复性速度很慢。 □低度重复序列在人类基因组中占60%-65%。 □低度重复序列中储存了巨大的遗传信息,编码各 种不同功能的蛋白质。 □低度重复序列的两侧往往为散在分布的重复序列。
五、多基因家族与假基因
(一)多基因家族
多基因家族(multigene family)是指由 某一祖先基因经过重复和变异所产生的一 组基因。如组蛋白基因家族、珠蛋白基因 家族。
3.线粒体基因组主要编码与生物氧化有关的一 些蛋白质和酶。
4.线粒体基因组可能还包括一些抗药性基因。
5.线粒体基因组有自己的rRNA、tRNA以及 核糖体等系统,因此线粒体本身的一些蛋白质基因 也可以在线粒体内独立地进行表达。
6.哺乳动物mtDNA的遗传密码与通用的遗传 密码有区别。
二、单顺反子结构
(二)中度重复序列
重复数十至数万次(<105)的重复序列
短分散重复片段
● Alu 家族:是哺乳动物基因组中含量最丰富的一种中
度重复序列家族.
● hinf 家族:(略)
长分散重复片段
● Kpn I家族
●组蛋白基因 ●超基因:一个基因簇中含有几百个功能相关的基因,
这样的基因簇称为超基因。如人类主要组织相容性抗原 复合体HLA和免疫球蛋白重链与轻链基因。
内含子与外显子的概念也是相对的.
●间隔区DNA:
真核生物基因之间存在编码空白区或转录的空白区,称之为 间隔区DNA(spacer DNA),这些序列往往在单拷贝的结构基 因侧翼,并使结构基因彼此分开,间隔区DNA也可以存在于 rDNA区。
四、重复序列
根据复性动力学将真核生物基因组DNA的重复 序列分为三类: (一)高度重复序列:重复频率达百万(106)以上。
体(chromosome)。 除配子细胞外,体细胞有两个同源染色体,
因此基因组有两份同源的基因组。 染色体储存于细胞核内,是基因组遗传信
息的载体。
(二)线粒体基因组
1.为双链环状超螺旋分子,类似于质粒。
2.mtDNA的复制属于半保留复制,可以是θ 型复制,或滚环复制,或D环复制,由线粒体 DNA聚合酶催化完成。
④与进化有关:具有种属特异性,但相近种属又有相似性; ⑤与个体特征有关:同一种属中不同个体的高度重复序列的 重复次数不一样,这可以作为每个个体的特征,即DNA指 纹;
⑥与染色体减数分裂时染色体配对有关:α卫星DNA成簇分 布在染色体着丝粒附近,同源染色体之间的联会可能依赖 于具有染色体专一性的特定卫星DNA序列。
互补拷贝在同一DNA链上
因碱基组成不同于其
反向排列而成。
他部分,用等密度梯度离
复性时,链内碱基 心法可与主体DNA分开,故 配对而呈现发夹式或“+” 称为卫星DNA或随体DNA。
字形结构。
3.α卫星DNA(α-satellite
重复序列之间没有 间隔的又称之为回文 (Palindrome)结构。
DNA)
真核细胞结构基因为单顺反子(monocistron), 一个结构基因经过转录生成一个单顺反子mRNA 分子,翻译成一条多肽链。真核生物基本上没有 操纵子结构。
三、断裂基因
真核细胞基因组的大部分序列属于非编码区。 编码区通常为结构基因,结构基因不仅在两侧有非 编码区,而且在基因内部也有许多不编码蛋白质的 间隔序列(intervening sequences),因此,真核 细胞的基因大多由不连续的几个编码序列所组成, 称之为断裂基因(split gene)。
3.细胞核基因组存在重复序列:重复次数可达百万次以上, 大多为非编码序列,因此基因组中不编码的区域多于编码 区域。
4.大部分基因有内含子,所以基因是不连续的。 5.真核生物基因组远远大于原核生物基因组,具有许多复
制起点,但每个复制子的长度较小。
一、细胞核基因组与细胞质基因组
(一)细胞核基因组 细胞核基因组的DNA与蛋白质结合形成染色
碱基组成的复杂度很低,因此其复性速率很快。 (二)中度重复序列:重复数十至数万次(<105)。 (三)低度重复序列:只出现一次或数次,复性速度很慢。
(一)高度重复序列
1. 反向(倒位)重复序列 2.卫星DNA(satellite
复性速度极快,又称 DNA)
零时复性部分。
重复单位一般由2~
由两个相同顺序的 10bp组成,且成串排列。
李建平
第三章 真核生物基因组
引言: 真核生物基因组比较庞大,并且不同生物种间 差异很大。
例如,人类单倍体基因组由3.16x109bP组成,如果以 1000个碱基编码一种蛋白质来计算,理论上可有300万 个基因。但实际上只有很少部分(约占2%—3%)的DNA 序列用于编码蛋白质。基因总数大概3.5万个。
由较复杂的重复单位所 组成,灵长类所独有。
卫星DNA或随体DNA(Satellite DNA)
因碱基组 成不同于其他 部分,用等密 度梯度离心法 可将卫星DNA 与主体DNA分 开。
CsCl等密度梯度离心
高度重复顺序的主要功能:
①参与复制水平的调节
②参与基因表达的调控
③参与转位作用:几乎所有转位因子的末端都包含反向重复 序列,可以形成回文结构,既能连接非同源的基因,又可 以被参与转位的特异酶所识别;
DNA的复性动力学研究:非编码区往往都是重 复序列。
第一节 真核生物基因组特点
1.分为细胞核基因组与细胞质基因组: 细胞核基因组是双份的(二倍体,diploid),即有两份
同源的基因组。 细胞质基因组可有许多拷贝。
2.真核细胞基因转录产物为单顺反子:一个结构基因经过 转录和翻译生成一个mRNA分子和一条多肽链。
●内含子(intron):
是结构基因中的非编码序列,往往与编码序列呈间隔排列。 当基因转录后,在mRNA的成熟过程中被剪切(splicing)。
●外显子(exon):
是结构基因中的编码序列,往往被内含子所间隔, 当基因 转录后,mRNA在成熟过程中切去内含子,外显子才被拼接成 完整的序列,成为成熟的mRNA作为指导蛋白质合成的模板。
中度重复顺序的主要功能
★ 中度重复序列大多不编码蛋白质。 ★有些中度重复序列则是编码蛋白质或
rRNA的结构基因:如HLA基因、rRNA基因、 tRNA基因、组蛋白基因、免疫球蛋白基 因等。 ★中度重复序列一般具有种属特异性。
(三)低度重复序列
在单倍体基因组中只出现一次或数次,因 而复性速度很慢。 □低度重复序列在人类基因组中占60%-65%。 □低度重复序列中储存了巨大的遗传信息,编码各 种不同功能的蛋白质。 □低度重复序列的两侧往往为散在分布的重复序列。
五、多基因家族与假基因
(一)多基因家族
多基因家族(multigene family)是指由 某一祖先基因经过重复和变异所产生的一 组基因。如组蛋白基因家族、珠蛋白基因 家族。
3.线粒体基因组主要编码与生物氧化有关的一 些蛋白质和酶。
4.线粒体基因组可能还包括一些抗药性基因。
5.线粒体基因组有自己的rRNA、tRNA以及 核糖体等系统,因此线粒体本身的一些蛋白质基因 也可以在线粒体内独立地进行表达。
6.哺乳动物mtDNA的遗传密码与通用的遗传 密码有区别。
二、单顺反子结构
(二)中度重复序列
重复数十至数万次(<105)的重复序列
短分散重复片段
● Alu 家族:是哺乳动物基因组中含量最丰富的一种中
度重复序列家族.
● hinf 家族:(略)
长分散重复片段
● Kpn I家族
●组蛋白基因 ●超基因:一个基因簇中含有几百个功能相关的基因,
这样的基因簇称为超基因。如人类主要组织相容性抗原 复合体HLA和免疫球蛋白重链与轻链基因。
内含子与外显子的概念也是相对的.
●间隔区DNA:
真核生物基因之间存在编码空白区或转录的空白区,称之为 间隔区DNA(spacer DNA),这些序列往往在单拷贝的结构基 因侧翼,并使结构基因彼此分开,间隔区DNA也可以存在于 rDNA区。
四、重复序列
根据复性动力学将真核生物基因组DNA的重复 序列分为三类: (一)高度重复序列:重复频率达百万(106)以上。
体(chromosome)。 除配子细胞外,体细胞有两个同源染色体,
因此基因组有两份同源的基因组。 染色体储存于细胞核内,是基因组遗传信
息的载体。
(二)线粒体基因组
1.为双链环状超螺旋分子,类似于质粒。
2.mtDNA的复制属于半保留复制,可以是θ 型复制,或滚环复制,或D环复制,由线粒体 DNA聚合酶催化完成。
④与进化有关:具有种属特异性,但相近种属又有相似性; ⑤与个体特征有关:同一种属中不同个体的高度重复序列的 重复次数不一样,这可以作为每个个体的特征,即DNA指 纹;
⑥与染色体减数分裂时染色体配对有关:α卫星DNA成簇分 布在染色体着丝粒附近,同源染色体之间的联会可能依赖 于具有染色体专一性的特定卫星DNA序列。
互补拷贝在同一DNA链上
因碱基组成不同于其
反向排列而成。
他部分,用等密度梯度离
复性时,链内碱基 心法可与主体DNA分开,故 配对而呈现发夹式或“+” 称为卫星DNA或随体DNA。
字形结构。
3.α卫星DNA(α-satellite
重复序列之间没有 间隔的又称之为回文 (Palindrome)结构。
DNA)
真核细胞结构基因为单顺反子(monocistron), 一个结构基因经过转录生成一个单顺反子mRNA 分子,翻译成一条多肽链。真核生物基本上没有 操纵子结构。
三、断裂基因
真核细胞基因组的大部分序列属于非编码区。 编码区通常为结构基因,结构基因不仅在两侧有非 编码区,而且在基因内部也有许多不编码蛋白质的 间隔序列(intervening sequences),因此,真核 细胞的基因大多由不连续的几个编码序列所组成, 称之为断裂基因(split gene)。
3.细胞核基因组存在重复序列:重复次数可达百万次以上, 大多为非编码序列,因此基因组中不编码的区域多于编码 区域。
4.大部分基因有内含子,所以基因是不连续的。 5.真核生物基因组远远大于原核生物基因组,具有许多复
制起点,但每个复制子的长度较小。
一、细胞核基因组与细胞质基因组
(一)细胞核基因组 细胞核基因组的DNA与蛋白质结合形成染色
碱基组成的复杂度很低,因此其复性速率很快。 (二)中度重复序列:重复数十至数万次(<105)。 (三)低度重复序列:只出现一次或数次,复性速度很慢。
(一)高度重复序列
1. 反向(倒位)重复序列 2.卫星DNA(satellite
复性速度极快,又称 DNA)
零时复性部分。
重复单位一般由2~
由两个相同顺序的 10bp组成,且成串排列。