第三章 基因与基因组的结构
遗传学第三章 基因的概念和结构
基因重叠方式
• Mis-reading for stop codon
( Q RNA virus 1973. A. Weiner )
400Nt
800Nt
AUG----------------------UGA-----------------------UAA
设有两个独立起源的隐性突变,具有类似的表现型。判断是属于同一个基因 突变,还是属于两个基因突变?即判断是否属于等位基因? ①建立双突变杂合二倍体; ②测定突变间有无互补作用。
• 顺反测验:顺式排列为对照(是两个突变座位位于同一条染色 体上),其表现型野生型。实质上是进行反式测验(反式排列是 两个突变座位位于不同的染色体上)。
① 反式排列为野生型:突变分属于两个基因位点; ② 反式排列为突变型:突变分属于同一基因位点。
Complementary assay
rII47 0
rII106 0
rII 47
rII106
rII106 0 rII51 0
rII106 rII51
Why?
plane E.coli K12
依据; One gene
2、假基因(pseudo gene)
• 假基因:同已知的基因相似,处于不同的位点,因缺失或突变而 不能转录或翻译,是没有功能的基因。
第五节、外显子和内含子
• 内含子(intron):DNA序列中不出现在成熟mRNA的片段; • 外显子(extron):DNA序列中出现在成熟mRNA中的片段。
Ovalbumin DNA X cDNA
5387 bp 11 genes 3 mRNA 9 peptides
基因与基因组的结构(精)
第3章基因与基因组的结构1.主要内容1)断裂基因构成性质2)重叠基因种类3)C值矛盾4)原核生物与真核生物基因组的区别5)真核生物染色体的结构6)真核生物DNA序列的4种类型7)基因家族、基因簇、卫星DNA、分散重复DNA 序列8)人类基因组计划2.教学要求1)掌握基因,断裂基因,顺反子,C值矛盾,重叠基因,基因家族,重复序列,卫星DNA等基本概念;2)熟悉原核生物和真核生物基因组结构特点与功能;3)了解人类基因组的重复顺序、人类基因组计划。
第1节基因的概念第2节基因命名简介第3节真核生物的断裂基因第4节基因及基因组的大小与C值矛盾第5节重叠基因第6节基因组第7节真核生物DNA序列组织第8节基因家族第9节人类基因组研究进展第1节基因的概念●基因:带有特定遗传信息的核酸分子片段。
包括结构基因:编码蛋白质tRNA rRNA调控基因:●基因研究的发展染色体分子反向生物学●基因位于染色体和细胞器的DNA分子上•基因和顺反子•1955,Benzer用以表述T4 具溶菌功能的区的2个亚区: rⅡA rⅡB•现代分子生物学文献中,顺反子和基因这两个术语互相通用。
第2节基因命名简介•表示基因3个小写斜体字母,lac•表示基因座3个小写斜体字母+ 1个大写斜体字母。
lacZ•表示质粒自然质粒 3 个正体字母,首字母大写重组质粒在2个大写字母前面加小写p•基因为斜体,蛋白质为正体•人类基因为大写斜体第3节真核生物的断裂基因•一、割裂基因的发现•1977,通过成熟mRNA(或cDNA)与编码基因的DNA杂交试验而发现•真核生物的基因是不连续的,大大改变了原来对基因结构的看法,现在知道大多数真核生物的基因都是不连续基因或割裂基因(split gene)。
•割裂基因的概念——是编码序列在DNA分子上不连续排列而被不编码的序列所隔开的基因。
•割裂基因的构成•构成割裂基因的DNA序列被分为两类:•基因中编码的序列称为外显子(exon),外显子是基因中对应于信使RNA序列的区域;•不编码的间隔序列称为内含子(intron),内含子是从信使RNA中消失的区域。
1.5基因及基因组的结构与特点
基因及基因组的结构与特点§1 基因与基因组一. 基因基因是DNA分子中含有特定遗传信息的一段核苷酸序列,是遗传物质的最小功能单位。
根据基因是否具有转录和翻译功能分为:二. 基因组(genome)基因组是指含有一个生物体生存、发育、活动和繁殖所需要的全部遗传信息的整套核酸。
基因组中不同的区域具有不同的功能,有些是编码蛋白质的结构基因,有些是复制及转录的调控信号,有些区域的功能尚不清楚。
功能基因组是指由表达基因构成的基因组。
基因组结构是指不同功能区域在整个DNA分子中的分布情况。
1. C值不同生物体的基因组大小和复杂程度各不相同,进化程度越高的生物体一般基因组越大也越复杂单倍基因组DNA含量(haploid DNA content)称为C值。
C值矛盾:人类基因组的C值只有3×109bp,肺鱼的C值比人高10多倍;亲缘关系相近的物种间,C值仍然相差很大:两栖类的不同物种间C值可相差100倍,被子植物不同物种间C值相差达1000倍,藻类5000倍,鱼类350倍,节肢动物250倍。
在原生动物不同物种间C值相差竟高达5800倍。
C值的大小并不说明遗传复杂性的高低,而只说明基因组中自私DNA(selfish DNA)的多少。
2. 基因结构一个基因组的核酸可分为编码区和非编码区两类序列。
(1)编码区:为mRNA、rRNA、tRNA以及其他各种RNA编码。
(2)非编码区:又可分为信号序列和非信号序列两类。
大都是一些大量的重复序列,它们或集中成簇,或分散在基因之间,可能在DNA复制、调控中具有重要意义,并与生物进化、种族特异性有关。
1)信号序列包括:复制起点、增强子、启动子、终止子及一切由调节蛋白识别和结合的序列。
2)非信号序列是指间隔区:间隔区并非不含有信息,有时信息不表现为核苷酸的顺序,而表现为序列的长度。
∙MS2外壳蛋白结构基因上游的非编码序列不得少于30nt,否则翻译效率降低10倍;∙真核基因的内含子并非编码序列,但其中含有重要信息,如5’剪接位点、3’剪接位点等;一些内含子的位置在不同物种之间保守,甚至其序列也有程度不同的保守。
(整理)第三章基因与基因组
第三章基因与基因组第一节基因概念的历史演变第二节DNA与基因第三节真核生物的割裂基因第四节基因大小第五节重叠基因第六节真核生物的基因组第七节真核生物DNA序列组织第八节细胞器基因组第九节基因鉴定第十节人类基因组计划第三章基因与基因组1 基因(gene)的概念基因是遗传的功能单位,DNA分子中不同排列顺序的DNA片段构成特定的功能单位;含有合成有功能的蛋白质多肽链或RNA所必需的全部核苷酸序列。
广义地说,基因是有功能的DNA片段。
第一节基因概念的历史演变2 基因概念的历史演变:(1)Mendel提出基因的存在(2)Morgan证实基因在染色体上(3)“一个基因一个酶”修正为“一个基因一个多肽链”“基因”一词的创立: 1909年,丹麦遗传学家约翰逊“基因”(gene)。
Gregor MendelThomas Hunt Morgan3 基因概念的理论基础3.1 一个基因一个酶1941年G W Beadle 和E L Tatum研究证实红色链孢霉各种突变体的异常代谢是一种酶的缺陷,产生这种酶缺陷的原因是单个基因的突变。
3.2 一个基因一条多肽链本世纪50年代,Yanofsky有些蛋白质不只由一种肽链组成,如血红蛋白和胰岛素,不同肽链由不同基因编码,因而又提出了“一个基因一条多肽链”的假设。
3.3 基因的化学本质是DNA(有时是RNA)1944年,O T Avery 证实了DNA是遗传物质。
有些病毒只含有RNA。
1953年沃森和克里克建立DNA分子的双螺旋结构模型。
3.4 基因顺反子(Cistron)的概念1955年,美国本兹尔(Benzer)提出顺反子的概念:是指编码一个蛋白质的全部组成所需信息的最短片段,即一个基因。
基因仅是一个功能单位,基因内部的碱基对才是重组单位和突变单位。
一对同源染色体上两突变(a和b)在同一染色体上时,称为顺式构型,在两个染色体上时,为反式构型;顺反互补测验(cis-trans test):比较顺式和反式构型个体的表型来判断两个突变是否发生在一个基因(顺反子)内的测验。
现代分子生物学 第三版 课后习题及答案(整理版)
朱玉贤-现代分子生物学第三版课后习题及答案(整理版)现代分子生物学课后习题及答案(共10章)第一章绪论1.你对现代分子生物学的含义和包括的研究范围是怎么理解的?答:分子生物学是从分子水平研究生命本质的一门新兴边缘学科,它以核酸和蛋白质等生物大分子的结构及其在遗传信息和细胞信息传递中的作用为研究对象,是当前生命科学中发展最快并正在与其它学科广泛交叉与渗透的重要前沿领域。
狭义:偏重于核酸的分子生物学,主要研究基因或DNA的复制、转录、表达和调节控制等过程,其中也涉及与这些过程有关的蛋白质和酶的结构与功能的研究。
分子生物学的发展为人类认识生命现象带来了前所未有的机会,也为人类利用和改造生物创造了极为广阔的前景。
所谓在分子水平上研究生命的本质主要是指对遗传、生殖、生长和发育等生命基本特征的分子机理的阐明,从而为利用和改造生物奠定理论基础和提供新的手段。
这里的分子水平指的是那些携带遗传信息的核酸和在遗传信息传递及细胞内、细胞间通讯过程中发挥着重要作用的蛋白质等生物大分子。
这些生物大分子均具有较大的分子量,由简单的小分子核苷酸或氨基酸排列组合以蕴藏各种信息,并且具有复杂的空间结构以形成精确的相互作用系统,由此构成生物的多样化和生物个体精确的生长发育和代谢调节控制系统。
阐明这些复杂的结构及结构与功能的关系是分子生物学的主要任务。
2.分子生物学研究内容有哪些方面?答:分子生物学主要包含以下三部分研究内容:A.核酸的分子生物学,核酸的分子生物学研究核酸的结构及其功能。
由于核酸的主要作用是携带和传递遗传信息,因此分子遗传学(moleculargenetics)是其主要组成部分。
由于50年代以来的迅速发展,该领域已形成了比较完整的理论体系和研究技术,是目前分子生物学内容最丰富的一个领域。
研究内容包括核酸/基因组的结构、遗传信息的复制、转录与翻译,核酸存储的信息修复与突变,基因表达调控和基因工程技术的发展和应用等。
遗传信息传递的中心法则(centraldogma)是其理论体系的核心。
第三章--基因与基因组的结构PPT课件
-
4
③近20年来,由于重组DNA技术的完善和应 用,人们已经改变了从表型到基因型的传统 研究基因的途径,而能够直接从克隆目的基 因出发,研究基因的功能及其与表型之间的 关系,使基因的研究进入了反向生物学阶段。
-
5
• 反向生物学:指利用重组DNA技术和离体 定向诱变的方法研究已知结构的基因相应的 功能,在体外使基因突变,再导入体内,检 测突变的遗传效应即表型的过程。
• 例如,对于大肠杆菌和其他细菌,用三个小写
字母表示一个操纵子,接着的大写字母表示不
同基因座,lac 操纵子的基因座:lacZ,lacY, lacA;其表达产物蛋白质则是lacZ,lacY,
lacA。
-
37
• 3.质粒和其他染色体外成分的命名 • 自然产生的质粒,用三个正体字母表示,第—
个字母大写,例如:ColEⅠ;
血破裂而使血红蛋白计数减少,造成贫血。
• 其本质是其血红蛋白的β-链与正常野生型
β-链之间的第6位氨基酸,由Val取代了 Glu所致。
-
32
• 这种贫血病是由基因突变造成的一种分子病,
除溶血后发生贫血外,还会堵塞血管形成栓塞, 从而伤及多种器官。
• 它的纯合子(通过单倍体形成的纯系双倍体)患
者在童年就夭折。
-
40
• 6.线虫基因的命名
• 用三个小写斜体字母表示突变表型,如存
在不止一个基因座,则在连字符后用数字
表示,如基因unc-86,ced-9;蛋白UNC-
86;CED-9。
-
41
• 7.植物基因的命名
• 多数用1~3个小写英文斜体字母表示。
-
42
• 8.脊椎动物基因的命名
基因组
(1)几个结构基因的编码区无间隔:几个基因 几个结构基因的编码区无间隔: 的编码区是连续的、不间断的, 的编码区是连续的、不间断的,即编码一条多 肽链,翻译后切割成几个蛋白质。 肽链,翻译后切割成几个蛋白质。 mRNA没有 ′端帽子结构 没有5 (2)mRNA没有5 ′端帽子结构 5 ′ 端非编码区 RNA形成特殊的空间结构称翻译增强子 形成特殊的空间结构称翻译增强子。 的RNA形成特殊的空间结构称翻译增强子。 (3)结构基因本身没有翻译起始序列,必须在 结构基因本身没有翻译起始序列, 转录后进行加工、剪接,与病毒RNA5 ′端的帽 转录后进行加工、剪接,与病毒RNA5 ′端的帽 结构相连,或与其它基因的起始密码子连接, 结构相连,或与其它基因的起始密码子连接, 成为有翻译功能的完整mRNA。 成为有翻译功能的完整mRNA。
细菌多数基因按功能相关成串排列,组成操纵元的基因 细菌多数基因按功能相关成串排列, 表达调控的单元,共同开启或关闭, 表达调控的单元,共同开启或关闭,转录出多顺反子的 mRNA; mRNA;真核生物则是一个结构基因转录生成一条 mRNA, mRNA是单顺反子 mRNA,即mRNA是单顺反子,基本上没有操纵元的结 是单顺反子, 构,而真核细胞的许多活性蛋白是由相同和不同的多肽 形成的亚基构成的, 形成的亚基构成的,这就涉及到多个基因协调表达的问 真核生物基因协调表达要比原核生物复杂得多。 题,真核生物基因协调表达要比原核生物复杂得多。 原核基因组的大部分序列都为基因编码, 基因组的大部分序列都为基因编码 原核基因组的大部分序列都为基因编码,而核酸杂交等 实验表明:哺乳类基因组中仅约10%的序列为蛋白质 基因组中仅约 的序列为蛋白质、 实验表明:哺乳类基因组中仅约10%的序列为蛋白质、 rRNA、tRNA等编码 其余约90%的序列功能至今还不 rRNA、tRNA等编码,其余约90%的序列功能至今还不 等编码, 清楚。 清楚。 原核生物的基因为蛋白质编码的序列绝大多数是连续的, 原核生物的基因为蛋白质编码的序列绝大多数是连续的, 而真核生物为蛋白质编码的基因绝大多数是不连续的, 而真核生物为蛋白质编码的基因绝大多数是不连续的, 即有外显子(exon)和内含子 和内含子(intron), 即有外显子(exon)和内含子(intron),转录后需经剪接 (splicing)去除内含子 才能翻译获得完整的蛋白质, (splicing)去除内含子,才能翻译获得完整的蛋白质,这 去除内含子, 就增加了基因表达调控的环节。 就增加了基因表达调控的环节。
生物第三章基因的本质知识点
生物第三章基因的本质知识点
生物第三章基因的本质主要包括以下知识点:
1. 基因的定义:基因是遗传信息的基本单位,是控制生物体形态、结构和功能的DNA 序列。
2. 基因的结构和组成:基因由DNA分子组成,包括编码区和非编码区。
编码区包含编码基因的信息,非编码区包含调控基因表达的元素。
3. 基因的功能:基因通过编码蛋白质来执行特定的功能,如调节细胞生长、发育和代
谢等。
4. DNA的复制:DNA分子在细胞分裂时通过复制过程来传递基因信息,确保每个新生细胞都有完整的基因组。
5. 基因的表达:基因表达是指基因转录为mRNA分子,并经过翻译过程产生蛋白质。
6. DNA的转录:DNA转录为mRNA过程包括启动子、RNA聚合酶、转录因子等多个
环节的参与。
7. 基因的翻译:mRNA通过核糖体和tRNA的参与,翻译成氨基酸序列,形成蛋白质。
8. 基因突变:基因突变指基因序列发生变化,包括点突变、插入突变、缺失突变等,
可能导致基因功能的改变。
9. 基因的遗传:基因通过遗传方式传递给下一代,确定了后代的表型和遗传特征。
10. 基因的调控:基因的表达可以受到内、外界环境的调控,通过启动子、转录因子等参与的调控元素来实现。
以上是关于生物第三章基因的本质的主要知识点,可以帮助我们理解基因的结构、功能和遗传规律。
第三章基因与基因组的结构
叶绿体基因组
叶绿体也属于半自主性的细 胞器,同mtDNA类似,叶绿体 DNA也以双链环状分子的形式 存在于细胞质中。
一般而言,一个顺反子就是一个基因, 大约1500个核苷酸。
它是由一群突变单位和重组单位组成 的线形结构(因为任何一个基因都是突变 体或重组体)。
基因是DNA分子上的功能单位,在染 色体或DNA分子上,基因成串排列,它既 是遗传的功能单位,同时也是交换单位 和突变单位。
但并非所有的DNA序列都是基因,只 有某些特定的多核苷酸区段才是基因的 编码区。
染色体上存在大量无转录活 性的重复DNA序列,主要有两 种形式:
➢ 串联重复的DNA,如卫星DNA,
成簇存在于染色体的特定区域;
➢ 分散重复的DNA,分散在染色体 的各个位点。
卫星DNA
有些高度重复的DNA序列 的碱基组成和浮力密度与主体 DNA不同,在CsCl密度梯度离 心时,可形成相对独立于主 DNA带的卫星带。
例如rRNA和某些tRNA基因以及重 复程度更高的卫星DNA等。
不同生物中 非重复基因占基 因组的比例差别 很大。原核生物 含有完全不重复 的DNA,低等真 核生物的大部分 DNA是非重复的, 高等真核生物中 非重复基因所占 基因组的比例更 低。
从不同种类的原核生物的Cot曲线可以看出, 各种原核生物的Cot曲线形状都很相似,跨度一 般只有两个数量级,只是Cot1/2值不同。表明各
➢ 单拷贝序列
➢ 轻度重复序列
分子生物学课件 第3章 基因与基因组
实际应用中“基因组”这个词既可以特指储存在细胞核中 的整套DNA(即核基因组),也可以指储存在细胞器中的 整套DNA(即线粒体基因组或叶绿体基因组),还可以指 一些非染色体的遗传元件,如病毒基因组、质粒基因组和 转座元件等。
不同基因家族各成员之间的序列 相似度也不同:
序列高度相似:经典的基因家族,如rRNA基因家族和组蛋 白基因家族。 保守性较低,但是编码产物具有大段的高度保守的氨基酸 序列。
序列保守性很低,编码产物之间也只有很短的保守氨基酸 序列,但通常由于具有保守的结构和功能区域,因而编码产 物具有相似的功能。
基因家族的成员在染色体上 的分布形式不同:
成簇存在的基因家族(clustered gene family)或称基因簇 (gene cluster),如人类类α链基因簇和类β链基因簇。 散布的基因家族(interspersed gene family),如肌动蛋白 基因家族和微管蛋白基因家族。
基因间隔区较短且内含子较少,基因排列紧密。
3.2.7 沉默基因
沉默基因( Silent Gene)也叫隐蔽基因(Cryptic gene), 是处于不表达状态的基因。它可能是假基因,也可能是被关闭的 基因。这些基因以隐性的方式埋藏在染色体中,但遇到特殊因子 的刺激,有可能解除关闭变成显性基因。
3.2.8 RNA基因
tRNA、rRNA; 核仁小分子RNA(small nucleolar RNA, snoRNA) 微小分子RNA(microRNA, miRNA); 小分子干扰RNA(small interfering RNA, siRNA); 核内小分子RNA(small nuclear RNA, snRNA);
3第三章 基因与基因组的结构和功能
(七)基因常常成簇排列,没有间隔序列或间隔序列很小。功 能相关蛋白质基因在基因组的1个或几个特定部位,丛集成 簇被转录成多顺反子,然后加工成各种蛋白质的mRNA模板。 如腺病毒晚期基因。 (八)不规则的结构基因 1.几个结构基因的编码区不规则,因此有些结构基因无翻译 起始序列。 2.有的mRNA(=gene)没有5’帽子,但有翻译增强子。 (九)DNA或RNA 1种病毒基因组只是1种核酸。
(三)连续的和不连续的基因 病毒基因结构特征往往与其 宿主细胞基因结构相似。 原核病毒(如噬菌体)基因是连续的,没有内含子; 真核病毒(如多瘤病毒)基因是不连续的,有内含子。 有意思的是,有些真核病毒的内含子或其中的一部分对 某一基因来说是内含子,对另一基因却是外显子。 如SV40和多瘤病毒的早期区域就是这样的。 除了(+)RNA病毒外,真核病毒基因都是先转成mRNA前 体,再经过剪接等步骤能成为成熟的mRNA.
存在重叠基因 Sanger在x174噬菌体DNA的全部序列后发现了重 叠基因现象。发现其中的9个基因是重叠的。 a) 一个基因完全在另一个基因里面,如基因B 在基因A里面,基因E在基因D内。 b)部分重叠,基因K和基因C部分重叠 c)两个基因只有一个碱基对的重叠,如D基因的 终止密码子的最后一个碱基是J基因起始密码子 的第一个碱基。 基因之间的间隔区很小
腺病毒基因组
腺病毒是一种无外壳的双链DNA病毒,基因组长约 36kb, 由于每条DNA链的5’-端同相对分子质量为55X103Da 的蛋白质分子共价结合,可以出现双链DNA的环状结 构。人体腺病毒已知有33种,分别命名为adl~ad33 人类腺病毒基因组包括早期基因E1A、E1B、E2A、 E2B、E3和E4 以及晚期基因L1、L2、L3、L4和L5 早期基因在病毒感染后的复制前开始转录。 腺病毒DNA可以整合到感染细胞或转化的细胞DNA 中,在腺病毒感染许可性的人类细胞时,病毒DNA与 宿主细胞DNA也可以发生重组。
基因与基因组的结构和功能
基因的结构和编码区和终止子组成。基因的编码方式可以是直接编码蛋白质 的mRNA,也可以是通过多个mRNA剪接变体实现。
基因组的定义
基因的功能及其调控
基因的功能涵盖了几乎所有生物过程。基因的表达可以通过转录因子、环境 信号和表观遗传调控等多种方式进行调控。
基因组是一个生物体细胞中所有基因的集合。它包含了编码蛋白质的基因以 及非编码RNA的序列。
基因组的组成和大小
基因组的组成包括核苷酸序列和非编码区域。核苷酸序列是基因组中编码蛋白质和RNA的基本单位。基因组的 大小可以根据不同生物体的复杂性而异。
基因与表型的关系
基因决定了生物体的遗传特征和表型表达。不同基因的组合以及基因和环境之间的相互作用决定了个体的表型。
基因与基因组的结构和功 能
在这个演讲中,我们将探讨基因和基因组的组成和功能。了解基因的定义, 构成成分以及基因组的组成和大小将有助于我们深入了解基因与表型之间的 关系以及基因的功能和调控。
基因的定义
基因是DNA分子上一段能够编码蛋白质的序列。这些蛋白质在细胞中扮演着 各种重要的功能角色。
基因的组成成分
分子生物学填空题
第二章 DNA 与染色体一、填空题1.病毒ΦX174及M13的遗传物质都是单链DNA 。
2.AIDS 病毒的遗传物质是单链RNA 。
3.X射线分析证明一个完整的DNA螺旋延伸长度为 3.4nm 。
4.氢键负责维持A-T间(或 G-C间)的亲和力。
5.天然存在的DNA分子形式为右手 B 型螺旋。
第三章基因与基因组结构一、填空题1.在许多人肿瘤细胞内,端粒酶基因的异常活化似乎与细胞的无限分裂能力有关。
2.包装为核小体可将裸露 DNA 压缩的 7 倍。
3.哺乳动物及其他一些高等动物的端粒含有同一重复序列,即 TTAGGG 。
4.细胞主要在分裂间期表达基因,此时染色体结构松散。
5.在所有细胞中都维持异染色质状态的染色体区,称为组成型异染色质。
6.在分裂间期呈现着色较深的异染色质状态的失活 X 染色体,也叫作巴氏小体。
7.果蝇唾液腺内的巨大染色体叫作多线染色体,由众多同样的染色质平行排列而成。
8.一般说来,哺乳动物线粒体与高等植物叶绿体的基因组相比,叶绿体更大些。
9.原生动物四膜虫的单个线粒体称作动粒。
第四章 DNA 复制一、填空题1.在 DNA 合成中负责复制和修复的酶是 DNA聚合酶。
2.染色体中参与复制的活性区呈 Y 开结构,称为 DNA复制叉。
3.在 DNA 复制和修复过程中,修补 DNA 螺旋上缺口的酶称为 DNA连接酶。
4.在 DNA复制过程中,连续合成的子链称为前导链,另一条非连续合成的子链称为后随链。
5.如果 DNA 聚合酶把一个不正确的核苷酸加到 3′端,一个含 3′→5′活性的独立催化区会将这个错配碱基切去。
这个催化区称为校正核酸外切酶。
6.DNA 后随链合成的起始要一段短的 RNA引物,它是由 DNA引发酶以核糖核苷酸为底物合成的。
7.复制叉上 DNA 双螺旋的解旋作用由 DNA解旋酶催化的,它利用来源于 ATP 水解产生的能量沿 DNA 链单向移动。
8.帮助 DNA 解旋的单链结合蛋白(SSB)与单链 DNA 结合,使碱基仍可参与模板反应。
分子生物学课件第三章 基因与基因组的结构
基因(gene) 1 基因(gene)
1.1 基因概念的发展
1866年G.J.Mendel提出 遗传因子”概念,但未将“基因” 提出“ ⑴ 1866年G.J.Mendel提出“遗传因子”概念,但未将“基因” DNA联系起来 联系起来。 遗传因子”只是一个假设的遗传单位。 与DNA联系起来。“遗传因子”只是一个假设的遗传单位。 1909年W.L.Johannson(丹麦 首创‘gene’一词 提出“ 丹麦) 一词, ⑵ 1909年W.L.Johannson(丹麦)首创‘gene 一词,提出“基 因型” 表现型” 因型”和“表现型”。“ A”、"B 代表显性。“ a”、"b ” 代 、"B” 代表显性。 、 表隐性。这些符号沿用至今。 表隐性。这些符号沿用至今。 1910年T.H.Morgen提出 基因”代表一个有机的化学实体。 提出“ ⑶ 1910年T.H.Morgen提出“基因”代表一个有机的化学实体。 40~50年代 DNA是遗传物质确成定论后 确立了“基因” 年代, 是遗传物质确成定论后, ⑷ 40~50年代,DNA是遗传物质确成定论后,确立了“基因” 是具有一定遗传效应的DNA片段的概念。 DNA片段的概念 是具有一定遗传效应的DNA片段的概念。 1955年Benzer提出顺反子 cistron)概念 提出顺反子( 概念。 ⑸ 1955年Benzer提出顺反子(cistron)概念。目前已从功能单 位的意义上把顺反子和基因统一起来。 位的意义上把顺反子和基因统一起来。一个顺反子可包含多个 突变子(muton)和重组子(recon)。 和重组子(recon) 突变子(muton)和重组子(recon)。
基因与基因组
gene and genome
引 言
基因的分子结构和组织对基因的表达有重要 的影响。 的影响。 基因的分子结构在原核生物中已搞的十分清 但在真核生物中还缺少完整的例子。 楚。但在真核生物中还缺少完整的例子。近几 年来各种生物基因组计划的开展, 年来各种生物基因组计划的开展,特别是最近 发展起来的生物信息学, 发展起来的生物信息学,为深入研究基因的分 子结构和组织奠定了基础。 子结构和组织奠定了基础。
基因的组织和结构
5. 噬菌体基因组中无内含子,但感染真核细胞 的病毒基因组中具有内含子(SV40早期基因T和t)
6. 有基因重叠(同ORF重叠、异ORF重叠和反 ORF重叠)。
7.大部分DNA用于编码蛋白质,只有一小部分是 不翻译的。不翻译区通常是基因表达的调控序列。
8. 调控序列可以被宿主细胞所识别,其遗传密 码和基因组的结构必须与宿主体系相匹配。
密码子结构与氨基酸侧链极性之间有一定关系
1)氨基酸侧链极性性质在多数情况下由密码子的第二个碱 基决定。第二个碱基为嘧啶(Y)时,氨基酸侧链为非极性, 第二个碱基为嘌呤(P)时,氨基酸侧链侧有极性.
▲ 简单转座子(插入序列,insertion sequence,IS):较 小,只有与转位有关的序列和促进转座过程所要的蛋白质如 转座酶的基因。
▲ 复杂转座子(Tn):除转位序列和蛋白质基因外,在 其中心区还含有一个或多个基因。
(5)基因重叠: 是一种转录单位,一个基因可决定多种
mRNA和蛋白质,如Bcl-X基因
但自私DNA并非真的自私,毫无功能。如有些调控 序列虽不编码任何蛋白,但对细胞代谢也有很大影响。 如在Ig和MHC基因的内含子部分发现有增强子的存在, 可以增强该基因的转录。
9. DNA序列组织的可变性:DNA序列从胚胎到成人并 非一成不变。如B细胞成熟过程中Ig基因结构的重排及 TCR基因在分化过程中的重排。
5. 存在重复序列
1)高度重复序列(>105次)。
(1)卫星DNA: 根据长度可将其分为3类
★卫星(satellite)DNA: 重复长度5-10bp, 其在人群中多态性不强。
★小卫星DNA:重复长度15-70bp,其在人群中 有高度的特异性。
★微卫星DNA(简单串联重复序列):重复长 度2-5bp,其在人群中存在个体间的高度变化,是 DNA指纹的形成基础。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
通过剪接( splicing) 作用除去不必要部 通过剪接 ( ) 内含子)剩下部分 外显子)连接成为成 分 (内含子 剩下部分 外显子 连接成为成 内含子 剩下部分(外RNA排序 是一致的。相同功能的基因的外显子机构 相似,易证明是同源的,有共同的祖先。 它的突变影响较大,不易遗传。 • 内含子在基因中的排序往往很混乱,它的 突变与基因功能没有关系,可以遗传下来。
在结构、功能很相似的同一类生物中, ② 在结构、功能很相似的同一类生物中,甚至在 亲缘关系十分接近的物种之间, 亲缘关系十分接近的物种之间,其C值可以相差 值可以相差 倍乃至上百倍。 数10倍乃至上百倍。 倍乃至上百倍 如两栖类动物中, 值小的低至 值小的低至10 以下, 值 如两栖类动物中,C值小的低至 9bp以下,C值 以下 大的高达10 大的高达 11bp。
质粒(plasmid) 质粒
• 质粒是细菌细胞内携带的染色体外 的共价闭合的环状DNA分子,能独 分子, 的共价闭合的环状 分子 立进行复制。 立进行复制。 • 只有在宿主细胞内才能复制 • 可以赋予宿主细胞特定的遗传性状
质粒的遗传控制
• 复制调控系统:控制质粒的拷贝数。由复 复制调控系统:控制质粒的拷贝数。 制起点、rep基因和 基因构成 制起点、 基因和cop基因构成 基因和 • 分配系统:使质粒在细菌分裂过程中精确 分配系统: 分配到子细胞中 • 细胞分裂控制系统:能抑制细胞分裂,使 细胞分裂控制系统:能抑制细胞分裂, 细胞分裂与质粒复制协调
3.2 基因命名简介
• • • • • • 三个小写英文斜体表示基因名字 lac 加上大写斜体字母表示基因座 lac A 正体书写表示蛋白质和表型 lac A 质粒 自然产生 CoeE Ⅰ 人工pUC18 动物 小写字母 sey 人 大写字母 MYC
3.3 真核生物的断裂基因
• 1977年Berget 发现基因是不连续的 • 断裂基因:基因的编码序列在DNA分子上 不连续排列,被不编码序列隔开。 • 外显子 • 内含子
ф×174噬菌体的基因结构 × 噬菌体的基因结构
3.5.2 真核生物的重叠基因
• 通常情况下真核生物中很少有重叠基因。
• 在特殊情况下,可以在几个外显子之间选 择性剪切以获得不同功能表达物。
利用多个加多聚(A)位点和不同的剪接方式产生不同的蛋白质
3.6 基因组
• 基因组(genome):细胞或生物体中, ):细胞或生物体中 ( ):细胞或生物体中, 一套完整单倍体的遗传物质的总和。 一套完整单倍体的遗传物质的总和。
3.5 重叠基因
• 3.5.1 原核生物的重叠基因 • 重叠基因在表达时利用不同阅读框。 • 重叠基因及基因内基因的现象反映了原核 生物利用有限的遗传资源表达更多生物功 能的能力。
H G A
F C J E D
蛋白D 蛋白
丙
谷
甘
缬
蛋 终止
……GCGGAAGGAGTGATGTAATGTCT…… 蛋白E 蛋白 精 赖 谷 终止 起始 丝 蛋白J 蛋白
4.含大量重复序列 4.含大量重复序列 5.非编码序列占90%以上 5.非编码序列占90%以上 非编码序列占90% 6.基因是断裂基因 6.基因是断裂基因 7.功能相关的基因构成各种基因家族 7.功能相关的基因构成各种基因家族 8.存在可移动的遗传因素 8.存在可移动的遗传因素
真核生物基因组的结构
的量远远大于编码蛋白质所需的量。 ③DNA的量远远大于编码蛋白质所需的量。 的量远远大于编码蛋白质所需的量 如哺乳动物的基因组由3× 组成, 如哺乳动物的基因组由 ×109bp组成,假定 组成 哺乳动物每个基因平均是10000bp,那么哺乳动 哺乳动物每个基因平均是 , 物基因组应该有300000个基因。但核酸杂交测 个基因。 物基因组应该有 个基因 定哺乳动物一个细胞中的mRNA种类约为 种类约为10000 定哺乳动物一个细胞中的 种类约为 考虑不同细胞基因表达的不同, 个,考虑不同细胞基因表达的不同,推算哺乳动 物基因组约有30000-40000个基因,这样来看, 个基因, 物基因组约有 - 个基因 这样来看, 基因组DNA量是已知基因的 倍,余下那么多 量是已知基因的10倍 基因组 量是已知基因的 DNA有什么功能? 有什么功能? 有什么功能
真核基因组结构庞大, 值矛盾: 真核基因组结构庞大,但C值矛盾: 值矛盾
C值的概念:一个单倍体基因组的DNA含量总是 值的概念:一个单倍体基因组的 值的概念 含量总是 恒定的,它通常称为该物种DNA的C值(C value)。 恒定的,它通常称为该物种 的 值 。
随着生物的进化,生物体的结构与功能越来越复杂, 随着生物的进化,生物体的结构与功能越来越复杂, 需要的基因产物种类也越来越多, 需要的基因产物种类也越来越多,也就是需要的基 因越多, 因越多,因而C值就越大。
基因与基因组大小与C 3.4 基因与基因组大小与C值矛盾
• 由于断裂基因的存在,基因远比它编码的 蛋白质信息大。主要取决于内含子的大小。 • 内含子通常比外显子大得多。比如二氢叶 酸还原酶基因
• 进化上断裂基因先在低等的真核生物中出 现。 • 比如酿酒酵母中内含子就较少,而哺乳动 物中内含子较多。 • 高等真核生物中开始出现长基因,多数在510Kb.
• 基因是遗传的单位,同时也是交换单位和 突变单位。
• 1955年Benzer提出顺反子概念。 • 即:一段能编码一条完整多肽链的核苷酸 片段。 • 现代生物学里面顺反子和狭义的基因概念 通用。
3.1.2 基因与多肽链
• 基因的主要产物是多肽链,其他还包括许 多编码RNA的基因。 • 20世纪中期 “一种基因一种酶” • 20世纪末期 密码子是基因与蛋白质的联系
3.6.1 原核生物的染色体基因组
• 原核生物基因组结构和功能的特点 • 质粒 • 原核生物基因组研究及意义
原核生物基因组的特点
1、通常仅有一条环状双链DNA分子组成,一 通常仅有一条环状双链DNA分子组成, DNA分子组成 般不具核小体结构。 般不具核小体结构。 2、基因组小,DNA含量低。 基因组小, 含量低。 基因组小 DNA含量低 只有一个复制起点。 3、只有一个复制起点。 结构简炼,基因组内多用于编码蛋白质。 4、结构简炼,基因组内多用于编码蛋白质。 重复序列少。 5、重复序列少。 存在转录单元。 6、存在转录单元。 有重叠基因,多顺反子。 7、有重叠基因,多顺反子。
• 真核生物中DNA可分为: 单拷贝序列 轻度重复序列 中度重复序列 高度重复序列
单拷贝序列:真核基因转录产物为单顺反子, 单拷贝序列:真核基因转录产物为单顺反子,即 一个编码基因转录生成一个mRNA分子,翻译生 分子, 一个编码基因转录生成一个 分子 成一条多肽链。 成一条多肽链。
β-珠蛋白的mRNA与基因杂交
β-珠蛋白的pre-mRNA与基因的杂交
鸡卵清蛋白mRNA与基因杂交图 鸡卵清蛋白mRNA与基因杂交图 mRNA
鸡卵清蛋白前体mRNA到成熟mRNA的过程 鸡卵清蛋白前体mRNA到成熟mRNA的过程 mRNA到成熟mRNA
断裂基因转录出包含全部顺序的初始转录 称为前体mRNA。 物,称为前体 。
基因的含义
• 狭义:能产生一个特殊蛋白质的DNA序列。
• 广义:一个基因应该是一个转录单位,它 包括转录的启动子及其上游的其他调控区 域、蛋白质编码区域和转录的终止序列等。
基因与DNA DNA分子 3.1.1 基因与DNA分子
• 基因是DNA分子的功能单位,在染色体或 DNA分子上,基因成串排列。
“自私”DNA:是指真核生物基因组中大量的非编码序列, 自私”DNA:是指真核生物基因组中大量的非编码序列, 包括分散的高度重复序列、中度重复序列、内含子和间隔 包括分散的高度重复序列、中度重复序列、 序列等。这些序列极少转录成mRNA并翻译成蛋白质, mRNA并翻译成蛋白质 序列等。这些序列极少转录成mRNA并翻译成蛋白质,它们 对细胞的存活、代谢等不作任何贡献, 对细胞的存活、代谢等不作任何贡献,它们存在的唯一目 的似乎就是复制自己,故称之为“自私”DNA。 的似乎就是复制自己,故称之为“自私”DNA。
质粒的遗传控制
• 位点特异重组系统:控制高拷贝质粒在 位点特异重组系统: 菌体中有形成多聚体, 菌体中有形成多聚体,使其在分裂时拆 开成单体, 开成单体,而向子代细胞平均分配 • 质粒的不相容性:具有相同复制起始位 质粒的不相容性: 点和分配区的两种质粒不能共存与一个 宿主菌
质粒的类型 • 接合型质粒、可移动型质粒和自传 接合型质粒、 递型质粒 • 严谨型质粒(stringent plasmid)、 严谨型质粒( )、 松弛型质粒(relaxed plasmid) 松弛型质粒 • 窄宿主谱及广宿主谱质粒
比如酵母菌的DNA含量约为 ×107bp,是细菌 含量约为2.3× 含量的5倍左右 比如酵母菌的 含量约为 ,是细菌DNA含量的 倍左右; 含量的 倍左右; 而哺乳动物的基因组DNA约为 ×109bp。 约为3× 而哺乳动物的基因组 约为 。
C值矛盾:在真核生物中,物种进化的复杂程 值矛盾:在真核生物中, 值矛盾 度与DNA含量 值并不完全一致,称之为 值矛盾 含量C值并不完全一致 度与 含量 值并不完全一致,称之为C值矛盾 (C value paradox)。 。 ①一些植物和两栖类动物,它们的DNA含量高达 一些植物和两栖类动物,它们的 含量高达 1010-1011bp,而人类 含量仅为10 ,而人类DNA含量仅为 9bp,显 含量仅为 , 然这是无法解释的。 然这是无法解释的
5’ (CAP)
(AAAA) 3’UTR
5’UTR Translation start site
Note: 5’ CAP, poly A tail and intron only present in eukaryotes UTR = untranslated region.
真核生物DNA DNA序列组织 3.7 真核生物DNA序列组织