基因组的结构

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基因组的结构

第一节基因组的一般概念

-------- 细胞或生物体中,一套完整单体的遗传物质的总和称为基因组(genome)。如人类基因组包含22条常染色体和X、Y两条性染色体上的全部遗传物质(又称核基因组)以及胞浆线粒体上的遗传物质。

--------基因组的结构主要指不同的DNA功能区域在DNA分子中的分布和排列情况。

不同生物体基因组的大小及复杂程度不同。一般来说,生物进化程度的高低与其DNA的大小、含量及复杂程度有一致性

第二节病毒、原核生物及真核生物基因组结构的一般特点

一、病毒基因组的一般结构特点

病毒基因组的结构特点可概括如下:

(一)不同病毒基因组大小相差较大。

(二)病毒基因组可由DNA组成,也可由RNA组成,但每种病毒颗粒只含1种核酸。

(三)DNA病毒基因组均由连续的DNA分子组成。多数RNA病毒基因组也由连续的核糖核酸链组成,但有些则以不连续的核糖核酸组成。

(四)常见基因重叠现象。

(五)病毒基因组的大部分是用来编码蛋白质的

(六)病毒基因组DNA序列中功能上相关的蛋白质基因往往丛集在基因组的一个或几个特定部位,形成1个功能单位或转录单元,它们可被一起转录成含有多个mRNA的分子(称为多顺反子mRNA),然后加工成各种蛋白质的mRNA模板。

(七)除逆转录病毒基因组有两个拷贝外,至今发现的病毒基因组都是单倍体,每个基因在病毒颗粒中只出现一次。

(八)噬菌体(细菌病毒)的基因都是连续的,而多数真核细胞病毒常含不连续基因。除正链RNA病毒外,真核细胞病毒的基因都是先转录成mRNA前体,再经加工切除内含子成为成熟的mRNA。

二、细菌染色体基因组结构的一般特点

细菌是典型的原核生物,其染色体基因组结构的一般特点可做如下概括:

(一)细菌染色体基因组通常仅由一条环状双链DNA分子组成。

(二)基因组中只有1个复制起点。

(三)具有操纵子结构。其中的结构基因为多顺反子,数个操纵子还可以由一个共同的调节基因(regulator gene)即调节子 (regulon)所调控。

(四)编码蛋白质的结构基因在细菌染色体基因组中是单拷贝的,但编码rRNA的基因往往是多拷贝的。

(五)和病毒基因组相似,不编码的DNA部分所占比例比真核基因组少得多。

(六)具有编码同工酶的同基因(isogene)。

(七)编码顺序一般不会重叠。这和病毒基因组是不同的。

(八)在DNA分子中具有多种功能的识别区域,这些区域往往具有特殊的序列,并且含有反向重复序列。

(九)在基因或操纵子的终末往往具有特殊的终止序列,可导致转录终止和使RNA聚合酶从DNA链上脱落。

(十)细菌基因组中存在着可移动的DNA因素,这种因素的移动是DNA介导的

三、真核生物基因组的总体特征

(一)真核生物基因组远大于原核生物基因组,也比较复杂。

(二)基因组中常具有许多复制起点。

(三)基因组DNA与蛋白质结合形成染色体,储存于细胞核内。

(四)基因组中不编码的区域远多于编码区域。

(五)真核生物的转录产物一般为单顺反子,即一个结构基因经转录生成一个mRNA分子,并且此mRNA分子仅翻译成一个多肽分子。

(六)大部分基因有内含子,因此基因编码区是不连续的。

(七)存在重复序列,重复次数可以是几次,几十次,甚至高达百万次。

(八)真核生物基因组中存在一些可移动的DNA因素,这些因素的移动多被RNA介导 (如在哺乳动物及人类中发现的逆转座子),也有被DNA介导的(如在果蝇及谷类中发现的 DNA转座子)。

第三节真核生物DNA的主要类型

在多细胞有机体编码蛋白质的基因中,约25%~50%是单拷贝的,即在1个单倍体细胞核中仅出现一次,而其余的编码蛋白质的基因则属于包含两个或多个相似基因的家族。1个基因家族里的不同基因成员常编码相似但氨基酸顺序略有不同的蛋白质,

编码5srRNA及tRNA的基因也是以多拷贝存在的。组蛋白基因家系的许多成员基因常以串联形式分布于基因组中。

在基因组中还有许多重复的DNA顺序,它们并不编码任何蛋白质及功能RNA。

其中有些重复的DNA顺序在同一物种不同个体的染色体上并不处于相同的位置,这些DNA顺序被称之为可移动的遗传因素(mobilegeneticelements)。

这些DNA顺序并无明显的生物学功能,因为它们似乎为自己的目的而组织,故有自私DNA(selfish DNA)之称。

第四节编码蛋白质的基因

一、编码蛋白基因仅占整个基因组的很小部分

二、单一编码蛋白基因( solitary protein-coding genes)

三、重复的编码蛋白基因及歧化基因

在许多蛋白家族中,不同蛋白质的氨基酸顺序具有很高的同源性。许多蛋白质家族包含从几个到多至20个成员,它们有着相似但不完全相同的氨基酸顺序。个别蛋白质家族可能包含数百个成员。

歧化基因——假基因

DNA区域与有功能的蛋白基因相似但没有功能的DNA顺序,这些DNA顺序被称为假基因。它们原来也是功能基因的重复,但DNA顺序的不断变化(如缺失、倒位或点突变等),导致了或使翻译终止,或使mRNA加工阻断的顺序积累,致使这些 DNA区域丧失功能。即使它们能被转录成RNA,也不能翻译成有功能的多肽链。

第五节编码rRNA、tRNA及组蛋白的串联重复基因

编码45s pre—rRNA、5sRNA、各种tRNA及组蛋白家族成员的基因在基因组中是以串联重复排列存在的,

一、rRNA及tRNA的重复

18s和28sRNA基因包含在同一个转录单位中,这一转录单位称为pre—rRNA基因。

1个rRNA基因簇(rDNA)含许多转录单位,转录单位之间为不转录的间隔区,该间隔区片段组成的类似卫星DNA的串联重复序列。在不同生物及同种生物的 rRNA重复单位之间的不转录间隔区长短相差甚大。

二、组蛋白的重复

组蛋白包含H1,H2A,H2B,H3及H4:5个主要种类,各种组蛋白基因以多拷贝(50 ~500)存在于多细胞有机体的全部细胞中。

相关文档
最新文档