第三章-基因与基因组的结构

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 在内含子上发生的突变不影响蛋白质的结
• 现代分子生物学文献中,顺反子和基因这两
个术语是互相通用的。一般而言,—个顺反 子就是—个基因,大约1500个核苷酸。它 是由一群突变单位和重组单位组成的线性结 构。
• 因此,顺反子的概念表明了基因不是最小单
位,它仍然是可分的,但确实是功能单位。
生物体内存在的游离核苷酸多是5’-核苷酸
在分子水平上,由于所有生物DNA基本结构都 一致,这是它们作为生物体的共性,又由于它 们DNA序列上的不同,就形成了千差万别的生 物界;
• 而蛋白质则为White,Tailless,Hedgehog
• 5.酵母基因的命名 • 一般用三个大写斜体字母表示基因的功能,
后面的数字表示不同的基因座;
• 例如,啤酒酵母基因GAL4,CDC28;其表
达的蛋白质则是:GAL4,CDC28;
• 但也有例外,例如非洲粟酒酵母基因是gal4,
cdc2;蛋白质为:Gal4,Cdc2。
用rⅡA或rⅡB的突变型分别单独感染大肠杆菌 K株细胞, 两种T4噬菌体都不能正常生长;
而用两种突变型混合感染K株细胞时,才溶菌 裂解,噬菌体正常生长;
由此认为:rⅡA和rⅡB是互补的突变型。
单突变体 rⅡA亚区
rⅡB亚区 野生型
有互补作用
野生型
野生型
无互补作用
突变型
单突变体
反式构型 两个突变发生在基因间(内) 互补起情况分析
• 这种不连续的基因又称断裂基因或割裂基
因(split gene)。
构成断裂基因的DNA序列被分为两类:
• 基因中编码的序列称为外显子(exon),外
显子是基因中对应于信使RNA序列的区域;
• 不编码的间隔序列称为内含子(intron),
内含子是在信使RNA被转录后的剪接加工 中去除的区域。
• 断裂基因由一系列交替存在的外显子和内含
在rⅡA亚区内发生了突变的T4噬菌体,能 与在ⅡB亚区发生了突变的T4噬菌体互补;
所以rⅡA和rⅡB是两个不同的功能单位。
1955年,Benzer用顺反子(cistron)一词, 将这两个亚区分别称为rⅡA顺反子和rⅡB顺 反子,即rⅡA基因和rⅡB基因。
可见一个顺反子就是一段核苷酸序列,能编 码一条完整的多肽链。这种多肽链既可以是 一种具有生物活性的蛋白质,又可以与其他 多肽链聚合形成复杂的蛋白质。
• T4噬菌体(T4-phage)为材料的研究发现,
遗传信息的交换并非完全发生在基因之间, 在基因内部也发生着交换与重组。
• 研究发现基因之间不同位点发生突变可以
互补,而基因内不同位点发生突变则不能 互补,说明基因是一个整体单位。
• 结论:基因既是遗传的功能单位,同时也
是交换单位和突变单位。
T4噬菌体是感染大肠杆菌(E.coli)的一种病
• 但在某些原核生物如古细菌和大肠杆菌的
噬菌体中也发现了断裂现象。
断裂基因共同的性质:
• 外显子在基因中的排列顺序与它在成熟
mRNA产物中的排列顺序相同;
• 每种断裂基因在所有组织中都具有相同的
内含子成分;
• 核基因的内含子通常含有无义密码子
(nonsense codon),因此一般没有编码 功能;
• 当一种蛋白质是由多亚基构成的聚合体时
(异源多聚体蛋白质),“一个基因一条 多肽链”。
• “一种基因一种酶”的假说在20世纪中期
得到了许多学者的认同。
• 1957年,英国剑桥Ingrain在对镰形红细
胞贫血症的血红蛋白和正常血红蛋白的氨 基酸序列进行的对比研究中,第一次用实 验证实了基因与蛋白质之间的直接关系。
• 6.线虫基因的命名
• 用三个小写斜体字母表示突变表型,如存
在不止一个基因座,则在连字符后用数字
表示,如基因unc-86,ced-9;蛋白
UNC-86;CED-9。
• 7.植物基因的命名
• 多数用1~3个小写英文斜体字母表示。
• 8.脊椎动物基因的命名
• 用描述基因功能的1~4个小写字母和数字
• DNA和相应信使RNA结构上的差异(断裂基因
存在)在真核生物中普遍存在。
• 但也有一些真核生物的结构基因不含内含子,
如在酵母基因组中大部分的基因是不中断的, 组蛋白基因和干扰素基因等直接对应于其蛋 白质产物。
• 某些低等真核生物的线粒体以及叶绿体基因
中也发现有断裂基因。
• 断裂基因百度文库细菌中较为少见。
• 为便于学习理解,根据现代分子生物学中目
前使用最多的方法暂归纳如下:
• 1.用三个小写英文斜体字母表示基因的
名称,例如涉及乳糖代谢相关的酶基因:
lac;涉及亮氨酸代谢相关的酶基因:leu。
• 2.在三个小写英文斜体字母后面加上一个斜
体大写字母表示其不同的基因座。全部用正 体时表示蛋白产物和表型;
• 杂合子有两种构型 • 顺式构型,两个突变位于同一条染色体上 • 反式构型,两个突变位于同源的两条染色
体上
• 上面的互补实验中的杂合子为反式构型。
(见下图)
单突变体 rⅡA亚区
rⅡB亚区 野生型
有互补作用
野生型
野生型
单突变体
反式构型 两个突变发生在基因间可以互补
根据Benzer的计算:在功能DNA中,最小交 换单位约为l~3个核苷酸。这与DNA单链结 构中核苷酸是最小的结构单位的理论极为接 近。因此,顺反子中的最小交换单位(交换子) 和最小突变单位(突变子),都应该是DNA分 子中的一个核苷酸对。
基因还可以发生突变和重组,导致产生有
利、中性、有害或致死的变异。
• 根据不同历史时期的研究水平,基因研究
大体上分为三个发展阶段:
• ①在20世纪50年代以前,主要从细胞的染
色体水平上进行研究,属于基因的染色体 遗传学阶段;
• ②20世纪50年代之后,主要从DNA大分子
水平上进行研究,属于基因的分子生物学 阶段;
者在童年就夭折。
• 现已证实绝大多数异常血红蛋白都是在α-链或
β-链上发生一个氨基酸的取代替换所引起的。
• 基因的碱基序列与蛋白质分子中氨基酸的
序列之间的对应关系是通过遗传密码实现 的。
• 3.2 基因的命名
• 有关基因的命名方法现在并没有严格的统一。
随着分子生物学的飞速发展。许许多多的基 因组都已大规模被测序,更多的基因也不断 的被鉴定。因而十分需要一个统一的命名方 法。
Beale等应用X- 射线诱导处理红色面包霉, 获取了大量的营养缺陷突变体,进一步分析 发现,这些突变的每一种都是由于单基因缺 陷所致。
• 由此,Beade和Tatum在1941年提出了“一
种基因一种酶”假说。
• 认为生物体内发生的每—步代谢反应都由一
种特殊的酶催化,而这种酶又是其特定基因 的编码产物。一旦基因发生突变,由它指导 合成的蛋白质也随之发生变化,一般为改性 或失活。
• 例如,对于大肠杆菌和其他细菌,用三个小
写字母表示一个操纵子,接着的大写字母表
示不同基因座,lac 操纵子的基因座:lacZ, lacY,lacA;其表达产物蛋白质则是lacZ,
lacY,lacA。
• 3.质粒和其他染色体外成分的命名 • 自然产生的质粒,用三个正体字母表示,第—
个字母大写,例如:ColEⅠ;
毒,在它感染之后不到 30 min,寄主细胞就 会裂解死亡,并释放出约100个左右的子代噬 菌体颗粒,这种控制寄主细胞致死效应(快速溶 菌)的功能,是由该噬菌体的rⅡ区编码的。
深入研究发现rⅡ分为两个亚区:rⅡA 和rⅡB,它们各产生一种特殊的物质, 只有这两种物质同时存在时,才能使寄主 菌大肠杆菌K株的细胞溶菌裂解。
• 在O2分压较低环境中,镰形红细胞容易溶
血破裂而使血红蛋白计数减少,造成贫血。
• 其本质是其血红蛋白的β-链与正常野生型
β-链之间的第6位氨基酸,由Val取代了 Glu所致。
• 这种贫血病是由基因突变造成的一种分子病,
除溶血后发生贫血外,还会堵塞血管形成栓塞, 从而伤及多种器官。
• 它的纯合子(通过单倍体形成的纯系双倍体)患
第三章 基因与基因组的结构
3.1 基因的概念 基因(gene):是原核、真核生物以及病毒 的DNA和RNA分子中具有遗传效应的核苷 酸序列,是遗传的基本单位。
包括:
结构基因
(编码蛋白质、tRNA、rRNA)
调控基因
(编码调控蛋白)
• 基因通过对复制、转录和翻译过程进行调
控来实现对遗传性状发育的控制。
③近20年来,由于重组DNA技术的完善和应 用,人们已经改变了从表型到基因型的传统 研究基因的途径,而能够直接从克隆目的基 因出发,研究基因的功能及其与表型之间的 关系,使基因的研究进入了反向生物学阶段。
• 反向生物学:指利用重组DNA技术和离体 定向诱变的方法研究已知结构的基因相应的 功能,在体外使基因突变,再导入体内,检 测突变的遗传效应即表型的过程。
• DNA分子上不同的区域功能不同,并不是
所有的序列都具有编码功能。
• 在原核生物中结构基因占整个基因组DNA
的大部分。
• 在真核生物中结构基因占整个基因组DNA
一小部分。
• 在结构基因之间还含有大量没有编码功能
的间隔区。
—个基因是否表达是受到邻近编码区域的 DNA序列(调节基因)以及结合于其上的蛋 白质因子(比如转录因子)控制的。
基因主要位于染色体上,除了染色体DNA外, 细菌的质粒、真核生物的叶绿体、线粒体等 细胞器都含有一定的DNA序列,其上大部分 是具有遗传功能的基因,这些染色体外的 DNA称为染色体外遗传物质。
• 3.1.1 基因与DNA分子
• 基因是DNA分子上的功能单位,在染色体
或DNA分子上,基因成串排列。
当与蛋白因子结合的DNA序列发生突变时, 蛋白质不能识别DNA,结果是被它调控的结 构基因不能表达。
所有这些DNA序列,包括表达蛋白质的结构 基因和调控序列都构成了生物界复杂的遗传 信息。
从这个意义上讲,我们可以把遗传单位的概 念从基因扩展为转录单位,转录单位包括转 录的启动子及其上游的其他调控区域、基因 本身和转录的终止序列等。
• 此法还可确定内含子在基因中的位置和大
小(图3-1)。
• 必须从mRNA原初转录产物(hnRNA)中去
除内含子序列,以产生一个只由外显子构 成的信使RNA (mRNA)。从原初转录产 物中除去内含子的过程叫做RNA剪接。
• 经过剪接后,所有的外显子按其在DNA上
相同的顺序连接在同一个RNA分子上。
表示其基因功能;
• 例如,基因sey,myc,蛋白Sey,Myc。
• 9.人类基因的命名
• 与脊椎动物相似,但需大写; • 例如基因是MYC、ENO1,蛋白质则为
MYC、ENO1。
• 3.3 真核生物的断裂基因
• 1977年Berget等首先发现,在真核生物基
因组中,基因是不连续的,在基因的编码 区域内部含有大量的不编码序列,从而隔 断了对应于蛋白质的氨基酸序列。
脱氧核糖
• 顺反互补测验(cis-trans test)可精确定
位两个突变间的关系。
• 两个纯合的亲本突变体杂交时,产生的杂
合体后代将遗传两个亲本的突变。
• 两个突变位于同一个基因上,杂合子中就
不存在野生型的基因,具有突变的表型(不 能互补)。
• 突变位于不同的基因上,杂合子表现为野
生型的表型,这种关系称为互补(可以互 补)。
• 重组质粒,则在两个大写字母之前加一个p,
大写字母表示构建该质粒的研究者或实验室。
• 例如:pSC 101,(SC代表StartleyCohen),
pMT555,(MT代表Manchester technology)。
• 4.果蝇基因命名 • 对突变表型的表示用1~4个字母代表。例如,
基因white(w),tailless(tll), hedgehog(hh) ;
子构成,基因的两端起始和结束于外显子, 对应于其转录产物RNA的5′和3′末端。
• 如果一个基因具有n个内含子。则相应地含
有n+1个外显子。
• 通过比较mRNA与DNA的分子杂交,研究
其结构发现,如果基因中含有内含子,因 为其mRNA中没有相应的序列,在所形成 的RNA-DNA杂交双链的某一部位就会出现 不能配对的单链环,即是内含子。
因此,来自两种生命形态(比如原核和真核) 的基因(DNA)可以相互融合重组;
基因的DNA共性是实现基因工程(DNA重组) 的重要理论基础之一。
• 3.1.2 基因与多肽链
• 基因的主要编码产物:多肽链、rRNA、
tRNA以及小分子RNA
1908年,Garrod在研究人类黑尿病(alkap tonurea)时认为,该病是由于缺乏某种酶催 化的代谢所引起的。
相关文档
最新文档