基因概念
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四节基因的概念和基因作用的调控
一、基因的概念及其发展
人们对基因的认识是不断深入的,因此关于基因的概念也是不断发展的。
(一)经典遗传学基因的概念
最初基因是决遗传性状的一个基本单位,它和孟德尔的遗传因子遇义词,它是根据试验结果推导出来的一种遗传单位,人们只能从它的作用或它所产生的遗传效应得知它的存在。
基因一词是由丹麦的遗传学家约翰逊提出来的,此时基因只是逻辑推理的产物,并无实质内容。
二十世纪30年代摩尔根等人建立了染色体和基因的遗传学说,证明基因以念珠学说:基因位于染体上是突变,重组和一定遗传功能三位一体不可分割的遗传单位。
二十世纪40年代以后,基因的细微结构的遗传分析证明,基因并不是最小的可分割的遗传单位。
1959年本译(Benzer)以T4为材料,进行顺反试验,结果发现在个基因仍然可以划分为若干个起作用的小单位,并根据它们的质和作用区分为三个单位。
1 顺反子(cistron 作用子)是基因的主要部分,它是一个功能单位。
一个顺反子通常就是一个基因,它是链上的一段核苷酸序列,决定着一种多肽的合成。
目前的研究发现有单顺反子基因和多顺反子基因。
有的顺反子只编码rRNA和tRNA。
2 突变子(mutor)是指一个基因内部能够引起性状突变的最小单位。
一个顺反子中包含多个突变子,有时一个核苷酸对就是一个突变子。
3 重组子(recon交换子)一个顺反子内部可以发生交换出现重组,不能由重组分开的最小单位。
(最基本单位)一个重组子可以小到一个核苷酸对。
本译的顺反试验:是用于测定具有相似表型的两个独立起源的隐性突变是否属于同一基因的突变试验。
1 其具体试验:两突变型m1×m2,测定F1(双突变杂合2n)两个突变体间有无互补作用。
2 结果分析,若有互补作用,其F1表现为野生型;若无互补作用,其F1表现为突变型。
这样两种不同的结果说明了什么呢?
若两个突变型来自同一顺反子内的突变,则两条同源染色体都只能转录成突变的mRNA 形成——→突变型。
若两个突变来自不同顺反子(基因),则每个突变相对位点上都有一个正常的野生型基因,因而可产生正常的mRNA,形成正常功能的蛋白质或酶,而表现野生型。
3 顺反试验中的顺反的含义
顺反指的是两个材料杂交所得F1(双突变杂合)个体中的顺式,反式两种不同的排列方式。
A 顺式排列指两个突变座位在同一条染色体上。
B 反式排列指两个突变座位在不同的染色体上。
(二)分子遗传学关于基因的概念
1 分子遗传学的发展揭示了遗传密码,使基因概念落实到具体物质上,DNA是主要的遗传物质,一个基因相当于DNA分子上一个特定的区段,它携有特殊的遗传效用。
根据DNA分子特定区段(基因)的功能差异,基因可分为结构基因,调节基因,操作基因和决定子。
A 结构基因——决定某一种多肽结构的一段DNA,它把携带的特定遗传信息转录给mRNA,再经mRNA为模板合成特定的AA序列多肽链。
B调节基因——调节多肽合成的基因,它能使结构基因在需要某种时就合成这种,不需要时,就停止合成。
C操纵基因——操纵结构基因的基因。
它位于结构基因(一个或多个)的一端,控制结构基因的活动。
调节基因和操纵基因都有控制结构基因的作用,但它们之间是有区别的,调节基因可以调节不同染色体上的结构基因,而操纵基因只是操纵同一染色体上的结构基因。
D 决定子——转录合成tRNA或rRNA的基因,在蛋白质合成过程中,起运载工具或组建蛋白质合成工厂的作用。
随着重组DNA技术和DNA序列分析技术的发展,对基因的认识有了进一步的发展,主要是发现了重叠基因,隔裂基因和跳跃基因(移动基因)
a 重叠基因——指同一段DNA的编码顺序,由于阅读柜架的不同或终止早晚的不同,同时编码两个或两个以上基因的现象。
目前已在φ174、G4噬菌体、SV40病毒等发现。
b间隔基因(interputed gene or splitting gene 隔裂基因)——基因的编码序列在DNA分子上是不连续的。
为一个或多个不编码的序列所隔开。
目前认为在RNA拼接过程中被删除的部分——内元(内含子)。
成熟的RNA上保留部分——外元(外显子)。
C 移动基因——(跳跃基因jumping genes)指能在染色体上移动位置的一段DNA序列,它本身没有任何表现效应,但能插入别的基因中引起突变或启动,关闭某些基因,常使基因发生缺失,重复,倒位等,所以它与生物进化有密切的关系,可能与个体发育及细胞变化有关。
自1949年美麦克林托克在玉米上发现以来,已在细菌酵母,果蝇等生物上发现。
总之,关于基因的概念仍在发展,但就目前而言,基因是DNA分子上一段特定的核苷酸序列。
它具有重组,突变,转录或对其他基因起调控作用的遗传学功能。
简单地讲,基因是DNA分子上具有一定遗传学功能的特定的核苷酸序列。
二、基因的作用与性状的表达
1 基因对性状的直接作用
基因→mRNA→结构蛋白或功能蛋白→性状,例如我们人类血红蛋白基因突变产生镰形细胞贫血病就是正常血红蛋白基因。
Hb A→Hb s、Hb c
血红蛋白是α、β各两条链形成,141AA,146AA。
三种血红蛋白的差异仅在于A链的第6位上一个氨基酸不同
DNA 由CTT——→CAT OR TTT
密码子由GAA——→GUA OR AAA
谷氨酸—→结氨酸、赖氨酸
由正常的红血球变成了镰形—→镰形贫血症。
2 基因对性状的间接作用
基因—→mRNA—→酶—→代谢过程—→性状的表达。
如三叶草氰酸含量遗传,就是通过控制L酶或H酶其为隐性而控制前驱物的转化从而达到降低氰酸含量的目的。
三、基因作用的调控
以下几个概念:
1 负调控系统(负控制系统)——在没有调节蛋白存在时基因表达,加入这种调节蛋白后基因表达活性被关闭。
负调控中的这种调节蛋白——阻遏蛋白。
2 正调控系统(正控制系统)——在没有调节蛋白存在时基因关闭,加入这种调节蛋白后基因活性被打开。
这种调节蛋白——诱导蛋白。
3 操纵元——原核生物基因表达和调控的一个完整单元。
它是由一个或几个结构基因,一个共同的调节基因,一组共同的控制位点(启动子promotor)和操纵子基因(oprator)组成的整个核苷酸序列。
(一)原核生物基因作用调控
1、基因表达的概念
一个细胞或病毒所携带的全部遗传信息或整套基因,称为基因组。
不同生物基因组所含基因多少不同。
在某一特定时期,基因组中只有一部分基因处于表达状态。
在个体不同生长时期、不同生活环境下,某种功能的基因产物在细胞中的数量会随时间、环境而变化。
基因表达就是基因转录及翻译的过程(图44)。
在一定调节机制控制下,大多数基因经历基因激活、转录及翻译等过程,产生具有特异生物学功能的蛋白质分子。
但并非所有基因表达过程都产生蛋白质。
rRNA、tRNA编码基因转录合成RNA的过程也属于基因表达。
2、基因表达调控的生物学意义
适应环境、维持生长和增殖生物体赖于生存的外环境是在不断变化的。
有生命体中的所有活细胞都必须对外环境变化作出适当反应,调节代谢,以使生物体能更好地适应变化着的外环境,维持生命。
这种适应调节的能力总是与某种或某些蛋白质分子的功能有关,即与相关基因表达有关。
生物体调节基因表达,适应环境是普遍存在的。
原核生物、单细胞生物调节基因的表达就是为适应环境、维持生长和细胞分裂。
高等生物也普遍存在适应性表达方式。
经常饮酒者体内醇氧化酶活性高即与相应基因表达水平升高有关。
维持个体发育与分化在多细胞个体生长、发育的不同阶段,细胞中的蛋白质分子种
类和含量差异很大;即使在同一生长发育阶段,不同组织器官内蛋白质分子分布也存在很大差异,这些差异是调节细胞表型的关键。
高等哺乳类动物各种组织、器官的发育、分化都是由一些特定基因控制的。
当某种基因缺陷或表达异常时,则会出现相应组织或器官的发育异常。
二、基因表达的规律
病毒、细菌,乃至高等哺乳类动物及人,基因表达表现为严格的规律性,即时间、空间特异性。
基因表达的时间、空间特异性由特异基因的启动子(序列)和/或增强子与调节蛋白相互作用决定。
时间特异性
噬菌体、病毒或细菌侵入宿主后,呈现一定的感染阶段。
随感染阶段发展、生长环境变化,有些基因开启,有些基因关闭。
按功能需要,某一特定基因的表达严格按特定的时间顺序发生,这就是基因表达的时间特异性。
在多细胞生物从受精卵到组织、器官形成的各个不同发育阶段,相应基因严格按一定时间顺序开启或关闭,表现为与分化、发育阶段一致的时间性。
因此,多细胞生物基因表达的时间特异性又称阶段特异性。
空间特异性
多细胞生物在个体某一发育和生长阶段,同一基因产物在不同的组织器官表达多少是不一样的;即使在同一生长阶段,不同的基因表达产物在不同的组织、器官分布也不完全相同。
在个体生长全过程,某种基因产物在个体按不同组织空间顺序出现,即基因表达的空间特异性。
基因表达伴随时间或阶段顺序所表现出的这种空间分布差异,实际上是由细胞在器官的分布决定的,因此基因表达的空间特异性又称细胞特异性或组织特异性。
三、基因表达的方式
不同种类的生物遗传背景不同,同种生物不同个体生活环境不完全相同,不同的基因功能和性质也不相同。
因此,不同的基因其表达方式或调节类型存在很大差异。
组成性表达
某些基因产物对生命全过程都是必需的或必不可少的,这类基因在一个生物个体的几乎所有细胞中持续表达,通常被称为管家基因。
例如,三羧酸循环是一中枢性代谢途径,催化该途径各阶段反应的酶编码基因就属这类基因。
管家基因较少受环境因素影响,而是在个体各个生长阶段的大多数、或几乎全部组织中持续表达,或变化很小。
这类基因表达被视为基本的、或组成性基因表达。
这类基因表达只受启动序列或启动子与RNA聚合酶相互作用的影响,而不受其它机制调节。
事实上,组成性基因表达水平并非真的"一成不变",所谓"不变"是相对的。
诱导和阻遏
与管家基因不同,另有一些基因表达极易受环境变化影响。
随外环境信号变化,这类基因表达水平可呈现升高或降低的现象。
在特定环境信号刺激下,相应的基因被激活,基因表达产物增加,这种基因是可诱导的。
可诱导基因在特定环境中表达增强的过程称为诱导。
例如有DNA损伤时,修复酶基因就会在细菌内被诱导激活,使修复酶反应性地增加。
相反,如果基因对环境信号应答时被抑制,这种基因是可阻遏的。
可阻遏基因表达产物水平降低的过程称为阻遏。
例如,当培养基中色氨酸供应充分时,在细菌内与色氨酸合成有关的酶编码基因表达就会被抑制。
可诱导或可阻遏基因除受启动序列或启动子与RNA聚合酶相互作用的影响外,尚受其它机制调节;一般,这类基因的调控序列含有特异刺激的反应元件。
诱导和阻遏是同一事物的两种表现形式,在生物界普遍存在,也是生物体适应环境的基本途径。
一、原核基因表达调控
1、原核基因表达调控特点
原核特异基因的表达也受多级水平调控(见第一节),但其表达开、关调控关键机制主要发生在转录起始。
概括原核基因转录调节有以下特点:
σ因子决定RNA聚合酶识别特异性原核生物细胞仅含有一种RNA聚合酶,核心酶参与转录延长,全酶司转录起始。
在转录起始阶段,σ亚基(又称σ因子)识别特异启动序列;不同的σ因子决定特异编码基因的转录激活,也决定不同RNA(mRNA、rRNA和tRNA)基因的转录。
操纵子(元)模型的普遍性除个别基因外,原核生物绝大多数基因按功能相关性成簇地串联、密集于染色体上,共同组成一个转录单位──操纵子(元),如乳糖(lac)操纵子、阿拉伯糖(ara)操纵子及色氨酸(trp)操纵子(元)等。
操纵子(元)机制在原核基因调控中具有较普遍的意义。
一个操纵子(元)只含一个启动序列及数个可转录的编码基因(通常为2~6个,有的多达20个以上)。
在同一启动序列控制下,操纵子(元)可转录出多顺反子mRNA。
原核基因的协调表达就是通过调控单个启动基因的活性来完成的。
阻遏蛋白与阻遏机制的普遍性在很多原核操纵子(元)系统,特异的阻遏蛋白是控制原核启动序列活性的重要因素。
当阻遏蛋白与操纵序列结合或解聚时,就会发生特异基因的阻遏或去阻遏。
原核基因调控普遍涉及特异阻遏蛋白参与的开、关调节机制。
2、乳糖操纵子(元)调节机制
乳糖操纵子(元)的结构 E.coli的乳糖操纵子(元)含Z、Y及A三个结构基因,分别编码半乳糖苷酶、透酶和乙酰基转移酶,此外还有一个操纵序列O、一个启动序列P及一个调节基因I(图)。
I基因编码一种阻遏蛋白,后者与O序列结合,使操纵子(元)受阻遏而处于关闭状态。
在启动序列P上游还有一个分解(代谢)物基因激活蛋白(CAP)结合位点。
由P序列、O序列和CAP结合位点共同构成lac操纵子的调控区,三个酶的编码基因即由同一调控区调节,实现基因产物的协调表达。
阻遏蛋白的负调节在没有乳糖存在时,lac操纵子(元)处于阻遏状态。
此时,I序列在PI启动序列操纵下表达的Lac阻遏蛋白与O序列结合,阻碍RNA聚合酶与P序列结合,抑制转录起动。
当有乳糖存在时,lac操纵子(元)即可被诱导。
在这个操纵子(元)体系中,真正的诱导剂并非乳糖本身。
乳糖进入细胞,经β-半乳糖苷酶催化,转变为半乳糖。
后者作为一种诱导剂分子结合阻遏蛋白,使蛋白构象变化,导致阻遏蛋白与O序列解离、发生转录。
异丙基硫代半乳糖苷(IPTG)是一种作用极强的诱导剂,不被细菌代谢而十分稳定,因此被实验室广泛应用。
CAP的正性调节分解(代谢)物基因激活蛋白CAP是同二聚体,在其分子内有DNA 结合区及cAMP结合位点。
当没有葡萄糖及cAMP浓度较高时,cAMP与CAP结合,这时CAP结合在lac启动序列附近的CAP位点,可刺激RNA转录活性,使之提高50倍;当有葡萄糖存在时,cAMP浓度降低,cAMP与CAP结合受阻,因此lac操纵子表达下降。
由此可见,对lac操纵子(元)来说CAP是正性调节因素,lac阻遏蛋白是负性调节因素。
两种
调节机制根据存在的碳源性质及水平协调调节lac操纵子的表达。
协调调节lac阻遏蛋白负性调节与CAP正性调节两种机制协调合作:当Lac阻遏蛋白封闭转录时,CAP对该系统不能发挥作用;但是如果没有CAP存在来加强转录活性,即使阻遏蛋白从操纵序列上解聚仍几无转录活性。
可见,两种机制相辅相成、互相协调、相互制约。
由于野生型lac启动序列作用很弱,所以CAP是必不可少的。
lac操纵子(元)的负性调节能很好地解释:单纯乳糖存在时,细菌是如何利用乳糖作碳源的。
然而,细菌生长环境是复杂的,倘若有葡萄糖或葡萄糖/乳糖共同存在时,细菌首先利用葡萄糖才是最节能的。
这时,葡萄糖通过降低cAMP浓度,阻碍cAMP与CAP结合而抑制lac操纵子转录,使细菌只能利用葡萄糖。
葡萄糖对lac操纵子的阻遏作用称分解代谢阻遏(catabolic repression)。
lac操纵子强的诱导作用既需要乳糖存在又需缺乏葡萄糖。
3、其它转录调节机制
原核基因通过操纵子(元)机制调节是主要的,此外尚有其它特异调节机制,如转录衰减、基因重组、SOS反应等。
二、真核基因表达调控
1、真核基因组结构特点
真核基因组结构庞大蕴藏着极为丰富的遗传信息如:E coli的DNA 分子长度约为1mm,约4500000核苷酸对,而人类精子中DNA总长度约1m,相当于大肠杆菌的1000倍。
其中表达的基因约占全部基因组的6%。
单顺反子与原核不同,真核基因转录产物为单顺反子,即一个编码基因转录生成一个mRNA分子、经翻译生成一条多肽链。
有很多真核蛋白质由几条不同的多肽链组成,因此存在多个基因协调表达的问题。
重复序列在原核、真核DNA中都有重复出现的核苷酸序列,但在真核更普遍。
重复序列长短不一,重复频率也不尽相同。
根据重复频率可将重复序列区分为高度重复序列(106次)、中度重复序列(103~104次)及单考贝序列。
基因不连续性真核结构基因两侧存在有不被转录的非编码序列,往往是基因表达的调控区。
在编码基因内部尚有一些不为蛋白质编码的间隔序列,称内含子;编码序列称外显子,因此真核基因是不连续的。
2、真核基因表达调控特点
同原核一样,转录起始仍是真核基因表达调控的最基本环节,而且某些机制是一样的。
但在下述方面与原核存在明显差别。
活性染色体结构变化当基因被激活时,可观察到染色体相应区域发生某些结构和性质变化,如活化基因对核酸酶极度敏感;当基因活化时,转录区DNA有拓扑结构变化;DNA 碱基修饰(如甲基化)变化及组蛋白变化。
正调节占主导真核RNA聚合酶对启动子的亲和力极小或根本没有实质性的亲和力,必需依赖一种或多种激活蛋白的作用。
尽管已发现某些基因含有负性顺式作用元件存在;很多真核调节因子既可作为激活蛋白又可作为阻遏蛋白发挥调节作用,但负性调节元件并不普遍存在。
较大真核基因组广泛存在正调节机制。
在正调节中,大多数基因不结合调节蛋白,所以是没有活性的;只要细胞表达一组激活蛋白时,相关靶基因即可被激活。
转录与翻译分隔进行真核细胞有细胞核及胞浆等区间分布,转录与翻译在不同细胞部位进行。
并且输送到质中的mRNA寿命比原核生物的长,从而为翻译水平的调控提供了余地。
转录后修饰、加工真核基因转录后剪接及修饰等过程比原核复杂。
真核基因转录激活调节
顺式作用元件在分子遗传学领域,相对同一染色体或DNA分子而言为“顺式”(cis);对
不同染色体或DNA分子而言为“反式”(trans)。
顺式作用元件是同一DNA分子中具有转录调节功能的特异DNA序列(图)。
按功能特性,真核基因顺式作用元件分为启动子、增强子及沉默子。
①启动子──是原核操纵子中启动序列的同义语。
真核基因启动子是RNA聚合酶结合位点周围的一组转录控制组件,每一组件含7~20 bp的DNA序列。
启动子包括至少一个转录起始点以及一个以上的机能组件。
在这些机能组件中最具典型意义的就是TATA盒,它的共有序列是TATAAAA。
TATA 盒通常位于转录起始点上游-25 ~-30 bp,控制转录起始的准确性及频率。
TATA盒是基本转录因子TFIID结合位点。
除TATA盒外,GC盒(GGGCGG)和CAA T盒(GCCAA T)也是很多基因常见的,它们通常位于转录起始点上游-30~-110 bp区域(图)。
这些调节蛋白又称转录调节因子,简称转录因子(TF)。
按功能特性可将其分为两类:①基本转录因子──是RNA聚合酶结合启动子所必需的一组蛋白因子,决定三种RNA转录的类别。
有人将其视为RNA聚合酶的组成成分或亚基,故称基本转录因子。
对三种RNA聚合酶来说,除个别基本转录因子成分是通用的,如TFIID;而大多数成分是不同RNA聚合酶所特有的。
例如TFIID、TFIIA、TFIIB、TFIIE、TFIIF及TFIIH为RNA聚合酶II催化所有mRNA转录所必需。
②特异转录因子──为个别基因转录所必需,决定该基因的时间、空间特异性表达,故称特异转录因子。
多数特异转录调节蛋白属DNA结合蛋白,具有DNA 结合域、转录激活域,此外还具有介导蛋白质-蛋白质相互作用的界面,如锌指蛋白(zinc finger)、螺旋-转角-螺旋蛋白(HTH)、螺旋-环-螺旋蛋白(HLH)及碱性亮氨酸拉链(bZIP)等(图)。
此类特异因子有的起转录激活作用,有的起转录抑制作用。
前者称转录激活因子,后者称转录抑制因子。
转录激活因子通常是一些增强子结合蛋白;多数转录抑制因子是沉默子结合蛋白,但也有抑制因子以不依赖DNA的方式起作用,而是通过蛋白质-蛋白质相互作用、"中和"转录激活因子或TFIID,降低它们在细胞内的有效浓度,抑制基因转录。
因为在不同的组织或细胞中各种特异转录因子分布不同,所以基因表达状态、方式不同。
mRNA转录激活及其调节真核基因mRNA转录激活就是“转录起始复合物”形成的过程,转录激活调节就是对转录起始复合物形成的调节。
真核RNA聚合酶II不能单独识别、结合启动子,而是先由基本转录因子TFIID组成成分TBP识别TATA盒或启动元件(Inr),并有TAF参与结合,形成TFIID─启动子复合物;继而在TFIIA~F等参与下,RNA聚合酶II与TFIID、TFIIB聚合,形成一个功能性的前起始复合物PIC。
在几种基本转录因子中,TFIID是唯一具有位点特异的DNA结合能力的因子,在上述有序的组装过程起关键性指导作用。
这样形成的前起始复合物尚不稳定,也不能有效起动mRNA转录。
在迂回折叠的DNA 构象中,结合了增强子的转录激活因子与前起始复合物中的TFIID接近,或通过特异的中介因子──TBP相关因子(TAF)与TFIID联系,形成稳定的转录起始复合物(图)。
此时,RNA聚合酶II才能真正起点mRNA转录。
TBP相关因子也是细胞特异的,与转录激活因子共同决定组织特异性转录。
真核基因转录激活调节是复杂的、多样的。
不同的DNA元件组合可产生多种类型的转录调节方式;多种转录因子又可结合相同或不同的DNA元件。
结合DNA前,特异转录因子常需通过蛋白质-蛋白质相互作用形成二聚体复合物。
组成二聚体的单体不同,所形成的二聚体结合DNA的能力不同,对转录激活过程所产生的效果各异,有正性调节或负性调节之分。
这样,基因调节元件不同,存在于细胞内的因子种类、性质及浓度不同,所发生的DNA-蛋白质、蛋白质-蛋白质相互作用类型不同,产生协同、竞争或拮抗,调节基因的转录激活方式。
二. 真核生物基因表达不同水平的调控。